本書全面介紹智能計算架構與軟件棧的基本原理和應用。內(nèi)容涵蓋:智能計算系統(tǒng)的基礎知識,主要包括定義、發(fā)展歷程;計算機體系結(jié)構基礎,詳述了指令系統(tǒng)、存儲系統(tǒng)、流水線技術和并行計算;AI加速器原理,重點介紹了發(fā)展歷史、設計思路、優(yōu)化設計和性能評價;AI加速器架構,深入分析了單核和多核架構;AI編譯器的工作原理和設計方法;基于TVM的定制化AI編譯器的設計;兩個海洋智能計算的實驗案例。
更多科學出版社服務,請掃碼獲取。
1. 1999.09—2003.07哈爾濱工程大學自動化學院、本科
2. 2003.09—2005.03哈爾濱工程大學自動化學院、碩士
3. 2004.09—2008.03哈爾濱工程大學自動化學院、博士1. 2005—2009哈爾濱工程大學自動化學院、助教
2. 2006—2007加拿大國家研究院、訪問學者
3. 2009—2011哈爾濱工程大學船舶與海洋工程學院、博士后
4. 2014—2015美國休斯敦大學、訪問學者
5. 2011—2018哈爾濱工程大學自動化學院、副教授
6. 2018—至今哈爾濱工程大學智能科學與工程學院、教授
7. 2019—2020哈爾濱工程大學智能科學與工程、副院長
8.2020—至今哈爾濱工程大學計算機科學與技術學院、院長模式識別與智能系統(tǒng),環(huán)境感知與無人系統(tǒng)、圖像處理及機器視覺、控制科學與工程等領域
目錄
第1章 概述 1
1.1 智能計算系統(tǒng) 1
1.1.1 智能計算系統(tǒng)的概念 1
1.1.2 智能計算系統(tǒng)的發(fā)展 2
1.2 智能計算系統(tǒng)中的硬件與軟件 4
1.2.1 智能計算系統(tǒng)中硬件的角色 4
1.2.2 智能計算系統(tǒng)中軟件棧的角色 6
思考題 8
第2章 計算機體系結(jié)構基礎 9
2.1 指令系統(tǒng) 9
2.1.1 指令系統(tǒng)概述 9
2.1.2 數(shù)據(jù)表示 12
2.1.3 尋址方式 15
2.1.4 指令類型與指令格式 17
2.2 存儲系統(tǒng) 20
2.2.1 存儲系統(tǒng)概述 20
2.2.2 存儲器技術與優(yōu)化 21
2.2.3 緩存性能與優(yōu)化 23
2.2.4 虛擬存儲器 26
2.3 流水線 28
2.3.1 流水線概述 28
2.3.2 流水線性能 31
2.3.3 流水線中的相關 35
2.4 并行 39
2.4.1 并行度與并行體系結(jié)構分類 39
2.4.2 指令級并行 41
2.4.3 數(shù)據(jù)級并行 52
2.4.4 分布式并行訓練系統(tǒng) 62
思考題 68
第3章 AI加速器原理 69
3.1 AI加速器概述 69
3.1.1 AI加速器的發(fā)展 69
3.1.2 AI加速器的設計思路 71
3.2 目標算法分析 72
3.2.1 計算特征 72
3.2.2 訪存特征 75
3.3 AI加速器優(yōu)化設計 80
3.3.1 運算部件設計 80
3.3.2 稀疏化設計 84
3.3.3 低位寬與混合精度設計 85
3.4 性能評價 86
3.4.1 性能指標 87
3.4.2 測試基準程序 87
3.4.3 影響性能的因素 88
思考題 89
第4章 AI加速器架構 90
4.1 單核AI加速器架構 90
4.1.1 總體架構 90
4.1.2 運算模塊 92
4.1.3 存儲與控制模塊 94
4.2 多核AI加速器架構 97
4.2.1 總體架構 98
4.2.2 Cluster 架構 99
4.2.3 互聯(lián)架構 103
4.3 AI加速器實例 105
4.3.1 Google TPU 105
4.3.2 TVM-VTA 106
4.3.3 NVDLA 108
4.3.4 華為昇騰AI處理器 109
思考題 111
第5章 AI編譯器基礎 112
5.1 傳統(tǒng)編譯器工作流程 112
5.1.1 LLVM編譯器前端 112
5.1.2 LLVM編譯器中間表示 114
5.1.3 LLVM編譯器后端 116
5.2 AI編譯器原理 119
5.2.1 AI編譯器的結(jié)構與特征 119
5.2.2 AI編譯器前端技術 120
5.2.3 AI編譯器后端與運行時 137
思考題 158
第6章 AI編譯器設計 159
6.1 TVM系統(tǒng)設計 159
6.1.1 TVM概述 159
6.1.2 TVM的計算圖優(yōu)化 161
6.1.3 TVM的計算與調(diào)度 165
6.1.4 TVM的自動調(diào)優(yōu)框架 166
6.2 華為MindSpore軟件棧設計 170
6.2.1 圖算融合 170
6.2.2 融合算子加速優(yōu)化框架AKG 173
思考題 175
第7章 基于TVM的定制化AI編譯器 176
7.1 TVM前端擴展 176
7.1.1 數(shù)據(jù)表示實現(xiàn) 176
7.1.2 自定義算子實現(xiàn) 179
7.2 TVM后端及運行時擴展 183
7.2.1 代碼生成的定制化開發(fā) 183
7.2.2 運行時的定制化開發(fā) 191
7.2.3 集成第三方硬件加速庫 196
思考題 213
第8章 海洋智能計算實驗 214
8.1 海洋智能信號預處理算子開發(fā)實驗 214
8.1.1 實驗目的 214
8.1.2 背景介紹 214
8.1.3 實驗內(nèi)容與步驟 218
8.2 海洋目標檢測應用開發(fā)實驗 219
8.2.1 實驗目的 219
8.2.2 背景介紹 219
8.2.3 實驗內(nèi)容與步驟 223
參考文獻 226