本書內(nèi)容主要包括機器學習的基本知識、基本學習方法、集成學習方法、深度學習方法和深度強化學習方法等內(nèi)容,將機器學習的經(jīng)典內(nèi)容與深度學習等前沿內(nèi)容有機地結(jié)合在一起,形成一套相對完整的知識體系,并在每個章節(jié)穿插相應的應用實例,使得廣大讀者不但能夠較好地掌握機器學習基本理論,而且能夠比較系統(tǒng)地掌握其應用技術,為今后的工作和進一步學習打下扎實的理論與應用基礎。
前言
第1章 機器學習概述 1
1.1 機器學習基本概念 1
1.1.1 人工智能與機器學習 1
1.1.2 機器學習基本術語 5
1.1.3 機器學習誤差分析 8
1.2 機器學習發(fā)展歷程 11
1.2.1 感知機與連接學習 11
1.2.2 符號學習與統(tǒng)計學習 13
1.2.3 連接學習的興起 17
1.3 機器學習基本問題 19
1.3.1 特征提取 19
1.3.2 規(guī)則構(gòu)建 23
1.3.3 模型評估 27
1.4 模型優(yōu)化與正則化 31
1.4.1 梯度下降法 31
1.4.2 隨機梯度法 34
1.4.3 模型正則化 36
1.5 習題 41
第2章 基本學習方法 43
2.1 監(jiān)督學習 43
2.1.1 線性模型 43
2.1.2 決策樹模型 50
2.1.3 貝葉斯模型 62
2.1.4 支持向量機 68
2.2 無監(jiān)督學習 72
2.2.1 聚類分析法 72
2.2.2 主分量分析法 76
2.3 強化學習 81
2.3.1 強化學習概述 81
2.3.2 馬爾可夫模型 84
2.3.3 值迭代學習 89
2.3.4 時序差分學習 94
2.4 基本學習方法的應用 103
2.4.1 垃圾郵件檢測與分類 103
2.4.2 人臉自動識別 106
2.4.3 自動爬山小車 112
2.5 習題 117
第3章 集成學習方法 119
3.1 集成學習概述 119
3.1.1 集成學習基本概念 119
3.1.2 集成學習基本范式 120
3.1.3 集成學習泛化策略 122
3.2 Bagging集成學習 124
3.2.1 Bagging集成策略 124
3.2.2 隨機森林模型結(jié)構(gòu) 127
3.2.3 隨機森林訓練算法 129
3.3 Boosting集成學習 142
3.3.1 Boosting集成策略 143
3.3.2 AdaBoost學習算法 145
3.3.3 GBDT學習算法 146
3.4 集成學習方法的應用 151
3.4.1 房價預測分析 151
3.4.2 人臉自動檢測 156
3.5 習題 162
第4章 深度學習方法 163
4.1 神經(jīng)網(wǎng)絡概述 163
4.1.1 神經(jīng)元與感知機 163
4.1.2 前饋網(wǎng)絡訓練范式 168
4.1.3 淺層學習與深度學習 176
4.2 深度卷積網(wǎng)絡 181
4.2.1 卷積網(wǎng)絡概述 181
4.2.2 基本網(wǎng)絡模型 190
4.2.3 改進網(wǎng)絡模型 199
4.3 深度循環(huán)網(wǎng)絡 206
4.3.1 動態(tài)系統(tǒng)展開 207
4.3.2 網(wǎng)絡結(jié)構(gòu)與計算 208
4.3.3 模型訓練策略 217
4.4 生成式對抗網(wǎng)絡 221
4.4.1 生成器與判別器 222
4.4.2 網(wǎng)絡結(jié)構(gòu)與計算 224
4.4.3 模型訓練策略 229
4.5 深度學習方法的應用 234
4.5.1 光學字符識別 235
4.5.2 圖像目標檢測 239
4.5.3 自動文本摘要 245
4.6 習題 249
第5章 深度強化學習 251
5.1 深度強化學習概述 251
5.1.1 基本學習思想 251
5.1.2 基本計算方式 254
5.1.3 蒙特卡洛樹搜索 255
5.2 基于價值的深度強化學習 261
5.2.1 深度Q網(wǎng)絡 261
5.2.2 深度雙Q網(wǎng)絡 266
5.2.3 DQN改進模型 270
5.3 基于策略的深度強化學習 273
5.3.1 策略梯度算法 273
5.3.2 Actor-Critic算法 278
5.3.3 DDPG學習算法 284
5.4 深度強化學習的應用 288
5.4.1 智能巡航小車 288
5.4.2 自動對弈游戲 292
5.5 習題 303
參考文獻 305