
內容簡介
本書全麵講述人工智能涉及的技術,學完本書後,讀者將對人工智能技術有全麵的理解,並能掌握AI整體知識架構。
本書共分11章,內容包括人工智能概述、AI產業、數據、機器學習概述、模型、機器學習算法、深度學習、TensorFlow、神經網絡、知識圖譜、數據挖掘,以及銀行業、醫療行業、公共安全、製造業等行業人工智能應用情況。附錄給出了極有參考價值的人工智能術語列表。
本書適合人工智能技術初學者、人工智能行業準從業人員、AI投資領域的技術專家,也適合作為高等院校和培訓學校人工智能相關專業師生的教學參考書。
作者簡介
楊正洪,畢業於美國StateUniversityofNewYorkatStonyBrook,在美國矽穀從事AI和大數據相關研發工作十餘年,華中科技大學和中國地質大學客座教授,湖北省2013年海外引進人才,並擁有多項國家專利。楊正洪參與了大數據和人工智能的國家標準的製定,在2016年參與了公安部主導的“信息安全技術:大數據平台安全管理產品安全技術要求”的國家標準製定。楊正洪是中關村海外智庫專家顧問和住建部中規院專家顧問,曾擔任在美上市公司CTO、北京某國企CIO和上海某國企高級副總裁等職。多年從事人工智能與大數據技術的實踐,出版了《智慧城市》《大數據技術入門》等多本暢銷書。
目錄
第1章人工智能概述11.1AI是什麼2
1.1.1火熱的AI2
1.1.2AI的驅動因素3
1.2AI技術的成熟度4
1.2.1視覺識別4
1.2.2自然語言理解5
1.2.3機器人7
1.2.4自動駕駛7
1.2.5機器學習8
1.2.6遊戲9
1.3AI與大數據的關係10
1.4AI與雲計算的關係13
1.5AI技術路線14
第2章AI產業16
2.1基礎層17
2.1.1芯片產業18
2.1.2GPU20
2.1.3FPGA20
2.1.4ASIC21
2.1.5TPU21
2.1.6的芯片22
2.1.7芯片產業小結23
2.1.8傳感器24
2.1.9傳感器小結26
2.2技術層27
2.2.1機器學習28
2.2.2語音識別與自然語言處理29
2.2.3計算機視覺32
2.3應用層34
2.3.1安防34
2.3.2金融35
2.3.3製造業37
2.3.4智能家居37
2.3.5醫療38
2.3.6自動駕駛40
2.4AI產業發展趨勢分析44
第3章機器學習概述47
3.1走進機器學習47
3.1.1什麼是機器學習47
3.1.2機器學習的感性認識48
3.1.3機器學習的本質48
3.1.4對機器學習的全麵認識50
3.1.5機器學習、深度學習與人工智能50
3.1.6機器學習、數據挖掘與數據分析51
3.2機器學習的基本概念53
3.2.1數據集、特征和標簽53
3.2.2監督式學習和非監督式學習54
3.2.3強化學習和遷移學習54
3.2.4特征數據類型56
3.2.5訓練集、驗證集和測試集56
3.2.6機器學習的任務流程57
3.3數據預處理57
3.3.1探索性分析58
3.3.2數據清洗58
3.3.3特征工程59
3.4算法60
3.5初探機器學習的開源框架61
3.5.1scikit-learn簡介62
3.5.2個機器學習實例62
3.5.3JupyterNotebook64
3.5.4多實例分析67
第4章特征工程72
4.1數據預處理72
4.1.1量綱不統一73
4.1.2把定量特征二值化(用於列向量)74
4.1.3對定性特征進行編碼74
4.1.4缺失值處理(用於列向量)76
4.1.5數據變換76
4.1.6數據預處理總結77
4.2特征選擇77
4.2.1Filter法78
4.2.2Wrapper法78
4.2.3Embedded法79
4.2.4特征選擇總結79
4.3降維79
4.4特征工程實例分析80
4.4.1數據相關性分析(手工選擇特征)80
4.4.2數據預處理82
4.4.3特征抽取85
4.4.4特征工程總結86
第5章模型訓練和評估88
5.1什麼是模型88
5.2誤差和MSE90
5.3模型的訓練91
5.3.1模型與算法的區別91
5.3.2迭代法92
5.4梯度下降法93
5.4.1步長94
5.4.2優化步長94
5.4.3三類梯度下降法95
5.4.4梯度下降的詳細算法96
5.5模型的擬合效果97
5.5.1欠擬合與過度擬合97
5.5.2過度擬合的處理方法98
5.6模型的評估99
5.6.1分類模型的評估99
5.6.2回歸模型的擬合效果評估106
5.6.3其他的評價指標106
5.7模型的改進106
第6章算法選擇和優化108
6.1算法概述108
6.1.1線性回歸109
6.1.2邏輯回歸109
6.1.3線性判別分析111
6.1.4分類與回歸樹分析111
6.1.5樸素貝葉斯112
6.1.6K近鄰算法113
6.1.7學習向量量化113
6.1.8支持向量機114
6.1.9隨機森林(RandomForest)115
6.1.10AdaBoost115
6.2支持向量機(SVM)算法116
6.3邏輯回歸算法118
6.4KNN算法119
6.4.1超參數k120
6.4.2KNN實例:波士頓房價預測121
6.4.3算法評價124
6.5決策樹算法124
6.6集成算法127
6.6.1集成算法簡述127
6.6.2集成算法之Bagging127
6.6.3集成算法之Boosting128
6.7聚類算法129
6.7.1K均值聚類130
6.7.2均值漂移聚類131
6.7.3基於密度的聚類算法132
6.7.4用高斯混合模型的大期望聚類133
6.7.5凝聚層次聚類134
6.7.6圖團體檢測135
6.8機器學習算法實例137
6.8.1訓練和預測138
6.8.2自動調參139
6.8.3嚐試不同算法141
第7章深度學習144
7.1走進深度學習144
7.1.1深度學習為何崛起145
7.1.2從邏輯回歸到淺層神經網絡145
7.1.3深度神經網絡147
7.1.4正向傳播148
7.1.5激活函數148
7.2神經網絡的訓練148
7.2.1神經網絡的參數148
7.2.2向量化149
7.2.3代價函數149
7.2.4梯度下降和反向傳播149
7.3神經網絡的優化和改進150
7.3.1神經網絡的優化策略150
7.3.2正則化方法152
7.4卷積神經網絡154
7.4.1卷積運算154
7.4.2卷積層155
7.4.3卷積神經網絡(CNN)實例156
7.5深度學習的優勢161
7.6深度學習的實現框架162
第8章TensorFlow164
8.1TensorFlow工具包164
8.1.1tf.estimatorAPI165
8.1.2Pandas速成165
8.1.3必要的Python知識167
8.2個TensorFlow程序169
8.2.1加載數據170
8.2.2探索數據171
8.2.3訓練模型171
8.2.4評估模型173
8.2.5優化模型175
8.2.6合成特征181
8.2.7離群值處理184
8.3過度擬合處理187
8.3.1訓練集和測試集188
8.3.2驗證集189
8.3.3過度擬合實例190
8.4特征工程199
8.4.1數值型數據199
8.4.2字符串數據和獨熱編碼(One-HotEncoding)199
8.4.3枚舉數據(分類數據)200
8.4.4好特征200
8.4.5數據清洗200
8.4.6分箱(分桶)技術202
8.4.7特征工程實例202
第9章TensorFlow知識212
9.1特征交叉212
9.1.1什麼是特征交叉212
9.1.2FTRL實踐214
9.1.3分箱(分桶)代碼實例217
9.1.4特征交叉代碼實例220
9.2L2正則化223
9.3邏輯回歸225
9.4分類227
9.4.1ROC和AUC227
9.4.2預測偏差228
9.4.3分類代碼實例229
9.5L1正則化241
0章神經網絡251
10.1什麼是神經網絡251
10.1.1隱藏層252
10.1.2激活函數253
10.1.3ReLU254
10.1.4實例代碼254
10.2訓練神經網絡263
10.2.1正向傳播算法263
10.2.2反向傳播算法265
10.2.3歸一化特征值267
10.2.4隨機失活正則化267
10.2.5代碼實例268
10.3多類別神經網絡284
10.3.1一對多方法284
10.3.2Softmax285
10.3.3代碼實例286
10.4嵌入301
10.4.1協同過濾301
10.4.2稀疏數據302
10.4.3獲取嵌入304
10.4.4代碼實例304
1章人工智能應用315
11.1銀行業315
11.2醫療行業316
11.3公共安全320
11.4製造業321
附錄A人工智能的歷史發展322
附錄B人工智能網上資料327
附錄C本書中采用的人工智能中英文術語330
附錄D術語列表332
······
最後修改:2024 年 07 月 25 日
© 允許規範轉載
