
內容簡介
《機器學習實戰:視頻教學版》基於Python語言詳細講解機器學習算法及其應用,用於讀者快速入門機器學習。本書配套示例源代碼、PPT課件、教學視頻、教學大綱、習題與答案、作者微信答疑。
《機器學習實戰:視頻教學版》共分12章,內容包括機器學習概述、Python數據處理基礎、Python常用機器學習庫、線性回歸及應用、分類算法及應用、數據降維及應用、聚類算法及應用、關聯規則挖掘算法及應用、協同過濾算法及應用,最後通過3個綜合實戰項目(包括新聞內容分類實戰、泰坦尼克號獲救預測實戰、中藥數據分析項目實戰),幫助讀者對所學技能進行鞏固和提升。本書主要章節都給出了對應的示例及其詳細的分析步驟,方便讀者從編程中掌握機器學習基礎算法及應用。
《機器學習實戰:視頻教學版》適合機器學習初學者、大數據分析人員和機器學習算法開發工程師閱讀;也適合作為高等院校或高職高專人工智能、計算機、軟件工程、數據科學與大數據技術、智能科學與技術等專業機器學習課程的教材。
作者簡介
遲殿委,計算機軟件與理論專業碩士,係統架構設計師。有十多年JavaEE、大數據全棧應用開發經驗和培訓經驗,擅長JavaEE架構設計、大數據分析與挖掘。著有圖書:《Spark入門與大數據分析實戰》《Hive入門與大數據分析實戰》《Hadoop大數據分析技術》《Hadoop+Spark大數據分析實戰》《Spring Boot企業級開發實戰(視頻教學版)》《深入淺出Java編程》《Spring Boot+Spring Cloud微服務開發》。
目錄
目錄第1章機器學習概述 1
1.1機器學習簡介 1
1.1.1什麼是機器學習 1
1.1.2機器學習三要素和核心 2
1.1.3機器學習開發流程 4
1.1.4機器學習模型評價指標 7
1.1.5機器學習項目開發步驟 10
1.2機器學習的發展史和分類 11
1.2.1機器學習的發展史 11
1.2.2機器學習分類 16
1.3機器學習常用術語 19
1.4本章小結 27
第2章Python數據處理基礎 28
2.1Python開發環境搭建 28
2.1.1安裝Python解釋器 28
2.1.2Python運行方法 30
2.1.3安裝PyCharm 31
2.1.4Python包管理工具 35
2.1.5安裝JupyterNotebook 36
2.2Python基本數據類型 37
2.2.1數值型 37
2.2.2字符串(String) 39
2.2.3列表(List) 41
2.2.4元組(Tuple) 50
2.2.5集合(Set) 54
2.2.6字典(Dict) 60
2.3Python文件的基本操作 65
2.3.1文件讀寫基本操作 65
2.3.2NumPy庫存取文件 69
2.3.3Pandas存取文件 73
2.4本章小結 74
第3章Python常用機器學習庫 75
3.1Python數值計算庫NumPy 75
3.1.1NumPy簡介與安裝 75
3.1.2NumPy數組的基本操作 76
3.2Python數據處理庫Pandas 77
3.2.1Pandas庫簡介與安裝 77
3.2.2數據讀取與寫入 77
3.2.3數據清洗與轉換 78
3.2.4數據分析與可視化 79
3.3Python數據可視化庫Matplotlib 80
3.3.1Matplotlib安裝與基本使用 80
3.3.2繪製折線圖 82
3.3.3繪製柱狀圖 84
3.3.4繪製餅圖 86
3.3.5繪製子圖 87
3.4Python機器學習庫scikit-learn 89
3.4.1sklearn簡介與安裝 89
3.4.2sklearn通用學習模式 89
3.4.3sklearn數據集 90
3.4.4sklearn模型的屬性和功能 91
3.4.5sklearn數據預處理 92
3.4.6交叉驗證 94
3.4.7保存模型 96
3.5本章小結 97
第4章線性回歸及應用 98
4.1線性回歸算法理論 98
4.2回歸算法的評價指標 100
4.3梯度下降算法 101
4.3.1算法理解 101
4.3.2SGD算法理論 102
4.4過擬合 103
4.4.1過擬合產生的原因 103
4.4.2常見線性回歸正則化方法 104
4.5線性回歸實戰 105
4.5.1波士頓房價預測 105
4.5.2加入正則化項 107
4.6本章小結 108
第5章分類算法及應用 109
5.1邏輯回歸理論與應用 109
5.1.1算法理論知識 109
5.1.2邏輯回歸算法實戰 110
5.2SVM理論及應用 118
5.2.1算法理論知識 119
5.2.2SVM算法實戰 120
5.3樸素貝葉斯分類及應用 129
5.3.1算法理論 129
5.3.2樸素貝葉斯實戰應用 130
5.4決策樹分類及應用 132
5.4.1算法理論 132
5.4.2ID3算法基礎 133
5.4.3決策樹算法實戰 136
5.5隨機森林算法實戰 140
5.6本章小結 141
第6章數據降維及應用 142
6.1數據降維概述 142
6.2PCA算法 143
6.2.1PCA算法理論 143
6.2.2PCA算法實戰 145
6.3SVD算法 147
6.3.1SVD理論 147
6.3.2SVD實戰應用 149
6.4本章小結 152
第7章聚類算法及應用 153
7.1聚類理論基礎 153
7.2K-Means聚類 154
7.2.1K-Means算法理論 154
7.2.2K-Means算法實戰 155
7.3高斯混合聚類 163
7.3.1高斯聚類理論 163
7.3.2高斯混合聚類應用 165
7.4譜聚類 166
7.4.1譜聚類理論基礎 167
7.4.2譜聚類應用實戰 168
7.5本章小結 171
第8章關聯規則挖掘算法及應用 172
8.1關聯規則挖掘算法理論 172
8.1.1大數據關聯規則挖掘常識 172
8.1.2經典的Apriori算法 173
8.1.3FP樹算法 174
8.2關聯規則挖掘算法實戰 177
8.2.1FP樹實戰 177
8.2.2Apriori算法實戰 182
8.3本章小結 186
第9章協同過濾算法及應用 187
9.1協同過濾算法理論 187
9.1.1協同過濾概述 187
9.1.2物品相似度計算 189
9.1.3關於ALS算法中的最小二乘法 190
9.2協同過濾算法電影推薦實戰 191
9.3本章小結 196
第10章新聞內容分類實戰 197
10.1數據準備 197
10.2分詞與清洗工作 199
10.3模型建立 202
10.4分類任務 203
10.5本章小結 205
第11章泰坦尼克號獲救預測實戰 206
11.1數據處理 206
11.2建立模型 209
11.3算法概率計算 210
11.4集成算法,構建多棵分類樹 210
11.5特征提取 211
11.6集成多種算法 214
11.7本章小結 215
第12章中藥數據分析項目實戰 216
12.1項目背景及目標 216
12.2數據處理與分析實戰 217
12.2.1數據讀取 217
12.2.2中藥材數據集的數據處理與分析 218
12.2.3提取藥方成分 221
12.2.4挖掘常用藥物組合 223
12.3本章小結 227
······
最後修改:2025 年 07 月 18 日
© 允許規範轉載
