多視圖深度學習是人工智能和機器學習領域的一個重要研究方向,在計算機視覺、自然語言處理和數(shù)據(jù)挖掘等領域廣泛應用。其核心在于探索如何利用深度學習模型,從多視角或多模態(tài)數(shù)據(jù)中提取有效信息,最終實現(xiàn)信息的融合與增強。本書內(nèi)容涵蓋部分傳統(tǒng)多視圖學習方法,以及當前主流的多視圖特征學習與深度表示學習方法。全書共10章,分為3個部分:第Ⅰ部分(第1、2章)闡述多視圖學習的研究背景、應用領域的研究現(xiàn)狀和未來發(fā)展趨勢;第Ⅱ部分(第3~5章)介紹多視圖特征學習的應用與研究成果;第Ⅲ部分(第6~10章)討論多視圖深度表示學習的應用與研究進展。
更多科學出版社服務,請掃碼獲取。
1988.9-1992.7,江蘇科技大學計算機及應用專業(yè),本科
1992.9-1995.7,南京理工大學模式識別與智能控制專業(yè),碩士
1995.9-1998.12,南京理工大學模式識別與智能控制專業(yè),博士1998.12-2001.7,中興通訊公司南京研究所工程師
2001.7-2004.3,中國科學院自動化研究所副研究員、附屬公司研究部副經(jīng)理
2004.3-2005.6,哈爾濱工業(yè)大學深圳研究生院副教授
2005.6-2007.1,哈爾濱工業(yè)大學深圳研究生院教授、博士生導師
2007.1-2018.8,南京郵電大學自動化學院教授、博士生導師、副院長
2011.6至今,武漢大學計算機專業(yè)博士生導師、楚天學者特聘教授
2018.8至今,廣東石油化工學院計算機學院院長1. 作為通訊作者、第一作者發(fā)表論文177篇,其中SCI檢索論文126篇、EI檢索51篇。
2. 代表性論文:
(1) 荊曉遠、張新玉等,Multiset Feature Learning for Highly Imbalanced Data Classification, IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI),2021,SCI影響因子23.6,中科院大類一區(qū);
(2) 賈曉棟、荊曉遠等,Semi-supervised Multi-view Deep Discriminant Representation Learning, IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI),2021,SCI影響因子23.6,中科院大類一區(qū);
(3) 賈曉棟、荊曉遠等,Human Collective Intelligence Inspired Multi-view Deep Representation Learning,IEEE擔任武漢大學-北京大學通用人工智能計劃(通計劃)博士生導師、華南理工大學博士生導師等;擔任國家自然科學獎會評專家、人工智能領域中科院SCI大類一區(qū)期刊《Pattern Recognition》等多個國際期刊編委、廣東省云機器人工程技術(shù)研究中心主任、廣東省石化裝備智能安全重點實驗室常務副主任、廣東省計算機學會常務理事、茂名市計算機學會會長、武漢大學B類學科帶頭人、香港理工大學客座研究員等;獲得教育部新世紀優(yōu)秀人才、湖北省楚天學者特聘教授、湖北省創(chuàng)新群體帶頭人、廣東省教育廳創(chuàng)新團隊帶頭人等計劃支持,入選愛思唯爾(Elsevier)中國高被引學者、全球前2%科學家等榜單。
目錄
前言
第Ⅰ部分 多視圖學習與深度學習
第1章 多視圖學習概述 3
1.1 背景與意義 4
1.2 多視圖學習研究現(xiàn)狀與進展 5
1.2.1 多視圖聚類方法研究 6
1.2.2 多視圖分類方法研究 9
1.2.3 多視圖回歸方法研究 14
1.2.4 多視圖決策方法研究 15
1.3 多視圖學習研究不足與展望 18
1.4 本書內(nèi)容安排 19
參考文獻 20
第2章 多視圖學習方法綜述 23
2.1 多視圖特征表示學習 24
2.1.1 基于連接的多視圖特征表示學習 24
2.1.2 基于對齊的多視圖特征表示學習 26
2.1.3 基于共享-獨有的多視圖特征表示學習 29
2.1.4 基于可解釋的多視圖特征表示學習 30
2.2 深度學習 31
2.2.1 深度有監(jiān)督學習 32
2.2.2 深度半監(jiān)督學習 33
2.2.3 深度無監(jiān)督學習 35
2.2.4 深度強化學習 37
2.3 本章小結(jié) 39
參考文獻 39
第Ⅱ部分 多視圖特征學習的應用與研究
第3章 基于子空間學習的多視圖特征學習方法 45
3.1 子空間學習概述及本章研究內(nèi)容 45
3.2 組遞歸鑒別子空間學習 47
3.2.1 樣本集分解與遞歸學習 47
3.2.2 投影向量選擇規(guī)則 49
3.2.3 矩陣形式遞歸學習終止準則 50
3.2.4 算法實現(xiàn)步驟 51
3.3 不相關局部敏感多視圖鑒別分析 51
3.3.1 局部敏感多視圖鑒別分析 52
3.3.2 跨視圖的一致性 53
3.3.3 不相關的多視圖變換 54
3.3.4 問題建模與目標函數(shù)優(yōu)化 54
3.4 實驗驗證與有效性評估 56
3.4.1 數(shù)據(jù)集介紹 56
3.4.2 對比方法及實驗設置 59
3.4.3 分類效果評估 59
3.4.4 GRDSL、ULSMDA關鍵組成部分評估 61
3.4.5 運行時間評估 63
3.4.6 參數(shù)敏感性評估 64
3.5 本章小結(jié) 65
參考文獻 65
第4章 基于字典學習的多視圖特征學習方法 67
4.1 字典學習定義及本章研究內(nèi)容 67
4.2 不相關多視圖鑒別字典學習 68
4.2.1 UMD2L方法模型 69
4.2.2 UMD2L目標函數(shù)優(yōu)化 70
4.2.3 基于字典編碼的分類機制 71
4.3 多視圖低秩字典學習 72
4.3.1 MLDL模型 73
4.3.2 MLDL目標函數(shù)優(yōu)化 75
4.3.3 MLDL的分類機制 78
4.4 多視圖低秩共享結(jié)構(gòu)化字典學習 80
4.4.1 MLS2DL模型 80
4.4.2 MLS2DL目標函數(shù)優(yōu)化 82
4.4.3 MLS2DL的分類機制 85
4.5 實驗驗證與有效性評估 86
4.5.1 數(shù)據(jù)集介紹 86
4.5.2 對比方法及實驗設置 88
4.5.3 分類效果評估 89
4.5.4 UMD2L、MLDL、MLS2DL關鍵組成部分評估 92
4.5.5 運行時間評估 95
4.5.6 參數(shù)敏感性評估 96
4.6 本章小結(jié) 101
參考文獻 101
第5章 基于半監(jiān)督鑒別分析的多視圖特征學習方法 103
5.1 半監(jiān)督鑒別分析定義及本章研究內(nèi)容 104
5.2 不相關半監(jiān)督視圖內(nèi)和視圖間流形鑒別學習 105
5.2.1 SI2MD機制 106
5.2.2 半監(jiān)督不相關約束 108
5.2.3 USI2MD總目標函數(shù)及分類機制 109
5.3 實驗驗證與有效性評估 110
5.3.1 對比方法及實驗設置 110
5.3.2 分類效果評估 111
5.3.3 USI2MD關鍵組成部分評估 113
5.3.4 運行時間評估 113
5.3.5 參數(shù)敏感性評估 114
5.4 本章小結(jié) 115
參考文獻 115
第Ⅲ部分 多視圖深度表示學習的應用與研究
第6章 基于譜內(nèi)識別與譜間相關分析深度網(wǎng)絡的多光譜人臉識別方法 119
6.1 多光譜深度學習研究基礎及本章研究內(nèi)容 120
6.2 基于譜內(nèi)識別與譜間相關分析的深度識別網(wǎng)絡 121
6.2.1 IDICN模型 121
6.2.2 譜內(nèi)識別分析 123
6.2.3 譜間相關分析 124
6.2.4 目標函數(shù)優(yōu)化與求解 125
6.3 實驗設置與結(jié)果分析 126
6.3.1 HK PolyU多光譜數(shù)據(jù)集上的實驗結(jié)果 128
6.3.2 CMU多光譜數(shù)據(jù)集上的實驗結(jié)果 129
6.3.3 UWA多光譜數(shù)據(jù)集上的實驗結(jié)果 131
6.4 有效性評估 132
6.4.1 識別效果評估 132
6.4.2 譜內(nèi)識別分析與譜間相關分析重要性評估 133
6.4.3 參數(shù)敏感性評估 135
6.5 本章小結(jié) 136
參考文獻 136
第7章 基于共享-獨有半監(jiān)督學習的多視圖深度鑒別表示學習方法 139
7.1 共享-獨有半監(jiān)督多視圖表示學習研究基礎及本章研究內(nèi)容 140
7.2 半監(jiān)督多視圖深度鑒別表示學習 141
7.2.1 共享-獨有多視圖深度鑒別表示學習框架 142
7.2.2 基于深度度量學習和密度聚類的半監(jiān)督學習方法 144
7.3 典型的多視圖學習任務評估 146
7.3.1 網(wǎng)頁分類 146
7.3.2 圖像分類 148
7.3.3 文檔分類 150
7.4 實驗驗證與有效性評估 152
7.4.1 消融實驗 152
7.4.2 改進對比損失函數(shù)的有效性 153
7.4.3 不同對齊策略的影響 155
7.4.4 不同半監(jiān)督學習策略的影響 155
7.4.5 平衡因子對方法性能的影響 156
7.4.6 訓練時間與收斂性 156
7.5 本章小結(jié) 159
參考文獻 159
第8章 基于協(xié)同嵌入的多視圖深度表示學習方法 162
8.1 協(xié)同嵌入研究基礎及本章研究內(nèi)容 162
8.2 協(xié)同嵌入多視圖表示學習框架 162
8.2.1 本章假設與相似性判斷策略 163
8.2.2 表示學習與坐標對齊 164
8.2.3 多視圖標記傳播算法 168
8.3 實驗驗證與有效性評估 170
8.3.1 數(shù)據(jù)集介紹 172
8.3.2 分類效果評估 173
8.3.3 特征表示對比 176
8.3.4 參數(shù)敏感性評估 179
8.3.5 訓練時間與收斂性 180
8.4 本章小結(jié) 182
參考文獻 183
第9章 視圖間具有互補信息交流的多視圖深度表示學習方法 185
9.1 多視圖間信息交流研究基礎及本章研究內(nèi)容 185
9.2 受人類群體智能啟發(fā)的多視圖深度表示學習方法 186
9.2.1 人類交流模型與整體架構(gòu) 186
9.2.2 單輪視圖交流模型 187
9.2.3 多輪視圖交流模型 191
9.2.4 表示學習與分類 192
9.3 不同領域的多視圖任務評估 193
9.3.1 醫(yī)學領域的對比 193
9.3.2 生物信息學領域的對比 195
9.3.3 機器學習領域的對比 195
9.4 實驗驗證與有效性評估 198
9.4.1 視圖交流有效性評估 199
9.4.2 參數(shù)敏感性評估 202
9.4.3 互補信息交流普適性 203
9.4.4 與協(xié)同學習方法的區(qū)別 203
9.5 本章小結(jié) 204
參考文獻 204
第10章 語義可解釋多視圖深度表示學習方法 207
10.1 可解釋性多視圖表示學習研究基礎及本章研究內(nèi)容 208
10.2 基于對齊的語義可解釋多視圖表示學習方法 209
10.2.1 基于對比學習的語義對齊表示學習網(wǎng)絡 209
10.2.2 基于表示激活映射RAM的多視圖語義相關性解釋框架 211
10.2.3 基于類別激活映射CAM的特征重要性解釋方法 213
10.3 實驗設置與結(jié)果分析 213
10.3.1 跨視圖檢索實驗 214
10.3.2 基于RAM的語義相關性解釋實驗 215
10.3.3 RAM兼容CAM實驗 220
10.4 有效性評估 222
10.4.1 方法適用場景與先進性 222
10.4.2 方法普適性 223
10.5 本章小結(jié) 223
參考文獻 224