
內容簡介
本書是一本機器學習實用指南,提供從基礎知識到進階技能的全麵學習路徑。本書以淺顯 易懂的方式介紹了機器學習的基本概念和主要類型,並詳細介紹使用 Python 及常見的庫進行數 據處理和機器學習的實操。此外,介紹了數據預處理的詳細過程,最後通過若幹典型案例加深 讀者對機器學習的理解。本書適合對機器學習感興趣的初學者,也可作為軟件開發人員、數據分析師、學術研究人員的參考書籍。
作者簡介
謝雪葵,畢業於北郵軟件學院計算機科學係軟件工程專業。在校期間,多次獲得專業一、二等獎學金,並成功帶領團隊進行了校園APP的研發工作。阿誠網絡的創始人,該公司專注於為企業提供大數據相關服務。主要業務包括為企業提供大數據技術支持和降低成本、提高效率的解決方案,同時也提供基於機器學習的預測模型和智能決策支持。在過去的多年裏,積累了豐富的企業級大數據項目實戰經驗,並負責大型銀行和互聯網公司的大數據項目開發和性能優化工作,其中包括使用機器學習技術進行風險評估、用戶行為分析和產品推薦等。
目錄
封麵
版權信息
內容簡介
前言
第1章 機器學習入門
1.1 機器學習簡介
1.1.1 什麼是機器學習
1.1.2 機器學習的前景
1.2 機器學習的主要類型
1.2.1 監督學習
1.2.2 無監督學習
1.2.3 半監督學習
1.2.4 強化學習
1.2.5 監督學習案例
1.3 選擇正確的算法
第2章 機器學習工具和環境
2.1 Python介紹
2.1.1 Python的安裝
2.1.2 Python基礎語法
2.1.3 Python其他特性
2.1.4 Python簡單實戰案例(猜字遊戲)
2.1.5 Python高級實戰案例(網絡爬蟲)
2.2 數據科學庫
2.2.1 NumPy
2.2.2 Pandas
2.2.3 數據科學庫案例(電商網站)
2.3 機器學習庫
2.3.1 Scikit-Learn
2.3.2 TensorFlow
2.3.3 Keras
2.3.4 機器學習庫案例(預測糖尿病)
第3章 數據預處理
3.1 數據導入
3.2 數據清洗
3.3 特征工程
3.3.1 特征選擇
3.3.2 特征轉換
3.3.3 特征縮放
3.4 數據分割
3.4.1 訓練集
3.4.2 測試集
3.4.3 驗證集
3.5 案例分析:銀行客戶數據
第4章 機器學習模型的構建與評估
4.1 監督學習實戰
4.1.1 線性回歸
4.1.2 邏輯回歸
4.1.3 決策樹
4.1.4 隨機森林
4.2 無監督學習實戰
4.2.1 K-means
4.2.2 主成分分析
4.3 深度學習實戰
4.3.1 神經網絡
4.3.2 卷積神經網絡
4.3.3 循環神經網絡
4.4 模型評估與選擇
4.5 案例分析:客戶流失預測
第5章 機器學習項目實戰
5.1 項目一:房價預測
5.1.1 數據獲取與理解
5.1.2 數據預處理
5.1.3 特征工程
5.1.4 模型構建與訓練
5.1.5 模型評估與優化
5.1.6 結果解釋
5.2 項目二:圖像識別
5.2.1 數據獲取與理解
5.2.2 數據預處理
5.2.3 特征工程
5.2.4 模型構建與訓練
5.2.5 模型評估與優化
5.2.6 結果解釋
5.3 項目三:自然語言處理
5.3.1 數據獲取與理解
5.3.2 數據預處理
5.3.3 特征工程
5.3.4 模型構建與訓練
5.3.5 模型評估與優化
5.3.6 結果解釋
5.4 項目四:新聞主題分類
5.4.1 數據獲取與理解
5.4.2 數據預處理
5.4.3 特征工程
5.4.4 模型構建與訓練
5.4.5 模型評估與優化
5.4.6 結果解釋
5.5 項目五:信用卡欺詐檢測
5.5.1 數據獲取與理解
5.5.2 數據預處理
5.5.3 特征工程
5.5.4 模型構建與訓練
5.5.5 模型評估與優化
5.5.6 結果解釋
第6章 機器學習的挑戰與前沿領域
6.1 機器學習的挑戰
6.1.1 數據問題
6.1.2 模型問題
6.1.3 計算問題
6.1.4 評估和解釋問題
6.2 機器學習的前沿領域
6.2.1 深度學習
6.2.2 強化學習
6.2.3 遷移學習
6.2.4 自適應學習和自監督學習
6.2.5 圖神經網絡
6.2.6 知識圖譜表示學習
6.2.7 因果機器學習
6.2.8 機器人處理自動化
6.2.9 AI優化硬件
6.3 機器學習的資源
版權信息
內容簡介
前言
第1章 機器學習入門
1.1 機器學習簡介
1.1.1 什麼是機器學習
1.1.2 機器學習的前景
1.2 機器學習的主要類型
1.2.1 監督學習
1.2.2 無監督學習
1.2.3 半監督學習
1.2.4 強化學習
1.2.5 監督學習案例
1.3 選擇正確的算法
第2章 機器學習工具和環境
2.1 Python介紹
2.1.1 Python的安裝
2.1.2 Python基礎語法
2.1.3 Python其他特性
2.1.4 Python簡單實戰案例(猜字遊戲)
2.1.5 Python高級實戰案例(網絡爬蟲)
2.2 數據科學庫
2.2.1 NumPy
2.2.2 Pandas
2.2.3 數據科學庫案例(電商網站)
2.3 機器學習庫
2.3.1 Scikit-Learn
2.3.2 TensorFlow
2.3.3 Keras
2.3.4 機器學習庫案例(預測糖尿病)
第3章 數據預處理
3.1 數據導入
3.2 數據清洗
3.3 特征工程
3.3.1 特征選擇
3.3.2 特征轉換
3.3.3 特征縮放
3.4 數據分割
3.4.1 訓練集
3.4.2 測試集
3.4.3 驗證集
3.5 案例分析:銀行客戶數據
第4章 機器學習模型的構建與評估
4.1 監督學習實戰
4.1.1 線性回歸
4.1.2 邏輯回歸
4.1.3 決策樹
4.1.4 隨機森林
4.2 無監督學習實戰
4.2.1 K-means
4.2.2 主成分分析
4.3 深度學習實戰
4.3.1 神經網絡
4.3.2 卷積神經網絡
4.3.3 循環神經網絡
4.4 模型評估與選擇
4.5 案例分析:客戶流失預測
第5章 機器學習項目實戰
5.1 項目一:房價預測
5.1.1 數據獲取與理解
5.1.2 數據預處理
5.1.3 特征工程
5.1.4 模型構建與訓練
5.1.5 模型評估與優化
5.1.6 結果解釋
5.2 項目二:圖像識別
5.2.1 數據獲取與理解
5.2.2 數據預處理
5.2.3 特征工程
5.2.4 模型構建與訓練
5.2.5 模型評估與優化
5.2.6 結果解釋
5.3 項目三:自然語言處理
5.3.1 數據獲取與理解
5.3.2 數據預處理
5.3.3 特征工程
5.3.4 模型構建與訓練
5.3.5 模型評估與優化
5.3.6 結果解釋
5.4 項目四:新聞主題分類
5.4.1 數據獲取與理解
5.4.2 數據預處理
5.4.3 特征工程
5.4.4 模型構建與訓練
5.4.5 模型評估與優化
5.4.6 結果解釋
5.5 項目五:信用卡欺詐檢測
5.5.1 數據獲取與理解
5.5.2 數據預處理
5.5.3 特征工程
5.5.4 模型構建與訓練
5.5.5 模型評估與優化
5.5.6 結果解釋
第6章 機器學習的挑戰與前沿領域
6.1 機器學習的挑戰
6.1.1 數據問題
6.1.2 模型問題
6.1.3 計算問題
6.1.4 評估和解釋問題
6.2 機器學習的前沿領域
6.2.1 深度學習
6.2.2 強化學習
6.2.3 遷移學習
6.2.4 自適應學習和自監督學習
6.2.5 圖神經網絡
6.2.6 知識圖譜表示學習
6.2.7 因果機器學習
6.2.8 機器人處理自動化
6.2.9 AI優化硬件
6.3 機器學習的資源
最後修改:2025 年 07 月 18 日
© 允許規範轉載
