本書在講述知識圖譜的定義、原理以及知識描述語言的基礎(chǔ)上,系統(tǒng)地介紹了構(gòu)建一個(gè)完整知識圖譜所需的技術(shù)和流程。主要內(nèi)容包括本體描述語言、知識圖譜建設(shè)綜述、知識建模 -構(gòu)建本體、知識獲取 -填充本體、知識融合 -完善圖譜、知識存儲 -高效訪問、知識計(jì)算和應(yīng)用 -推理引擎。附錄中簡要介紹了 RDF轉(zhuǎn)換器。本書讀者對象為從事知識管理系統(tǒng)開發(fā)的技術(shù)人員,以及對知識圖譜開發(fā)技術(shù)感興趣的相關(guān)人員。
1 知識圖譜基礎(chǔ)知識 1
1.1 知識圖譜定義和分類 1
1.2 知識圖譜基本技術(shù) 4
1.2.1 語義網(wǎng)絡(luò)概述 5
1.2.2 圖基本概念 8
1.2.3 圖表示和計(jì)算 11
1.2.4 實(shí)體、關(guān)系和屬性 18
1.2.5 本體(知識體系) 20
1.3 知識圖譜構(gòu)建方法和評價(jià)指標(biāo) 28
1.4 典型知識圖譜介紹 29
1.5 本章小結(jié) 31
2 本體描述語言 33
2.1 Web資源標(biāo)識符 33
2.2 資源描述框架RDF 34
2.2.1 RDF規(guī)則 35
2.2.2 RDF元素 36
2.2.3 RDF實(shí)例 39
2.2.4 RDF圖和知識圖譜 41
2.3 RDF模式RDFS 44
2.3.1 RDFS元素 44
2.3.2 RDFS實(shí)例 48
2.4 Web本體語言O(shè)WL 49
2.4.1 OWL元素 50
2.4.2 OWL實(shí)例 64
2.5 曼徹斯特語法 65
2.5.1 基于框架的知識表示 66
2.5.2 巴科斯規(guī)范 67
2.5.3 曼徹斯特語法 69
2.6 本體建模工具Protégé簡介 74
2.6.1 Protégé安裝 74
2.6.2 Protégé類表達(dá)式 76
2.7 本章小結(jié) 77
3 知識圖譜建設(shè)綜述 79
3.1 從本體到知識圖譜 79
3.2 知識圖譜建設(shè)原則 82
3.3 知識圖譜建設(shè)流程 83
3.4 知識圖譜開發(fā)流程 85
3.5 本章小結(jié) 87
4 知識建模-構(gòu)建本體 88
4.1 本體構(gòu)建原則 88
4.2 本體構(gòu)建方法 89
4.3 類層次架構(gòu)設(shè)計(jì)準(zhǔn)則 92
4.3.1 確保設(shè)計(jì)正確的類層次架構(gòu) 93
4.3.2 分析層次架構(gòu)中的兄弟類 93
4.3.3 考慮類的多重繼承 94
4.3.4 確定引入新類的時(shí)機(jī) 94
4.3.5 判斷屬性值和類的區(qū)別 94
4.3.6 判斷實(shí)例和類的區(qū)別 94
4.3.7 確定本體構(gòu)建范圍 95
4.3.8 聲明不相交的類 95
4.4 命名規(guī)范的考慮 95
4.5 本章小結(jié) 97
5 知識獲取-填充本體 98
5.1 實(shí)體抽取 98
5.1.1 命名實(shí)體規(guī)范 99
5.1.2 結(jié)構(gòu)化數(shù)據(jù)處理 103
5.1.3 半結(jié)構(gòu)化數(shù)據(jù)處理 114
5.1.4 非結(jié)構(gòu)化數(shù)據(jù)處理 114
5.2 實(shí)體屬性和關(guān)系抽取 143
5.2.1 實(shí)體關(guān)系抽取技術(shù)概述 143
5.2.2 基于依存句法分析的關(guān)系抽取 146
5.3 本章小結(jié) 154
6 知識融合-完善圖譜 156
6.1 實(shí)體對齊 156
6.1.1 實(shí)體對齊技術(shù) 157
6.1.2 實(shí)體對齊實(shí)現(xiàn) 162
6.2 實(shí)體消歧 167
6.2.1 實(shí)體消歧技術(shù) 168
6.2.2 實(shí)體消歧實(shí)現(xiàn) 171
6.3 指代消解 178
6.3.1 指代消解技術(shù) 179
6.3.2 指代消解實(shí)現(xiàn) 181
6.4 本章小結(jié) 183
7 知識存儲-高效訪問 185
7.1 知識存儲概述 185
7.2 圖數(shù)據(jù)庫Neo4j 187
7.2.1 Windows下安裝 189
7.2.2 Neo4j基礎(chǔ)知識 191
7.2.3 Neo4j基本使用 199
7.3 RDF數(shù)據(jù)操作 202
7.3.1 Neosemantics插件安裝 203
7.3.2 Neosemantics功能列表 206
7.3.3 RDF數(shù)據(jù)的導(dǎo)入導(dǎo)出 212
7.4 Python訪問Neo4j 214
7.4.1 Python訪問Neo4j 214
7.4.2 Python程序示例 217
7.5 本章小結(jié) 219
8 知識計(jì)算和應(yīng)用-推理引擎 220
8.1 知識推理 220
8.1.1 基于描述邏輯的推理 220
8.1.2 基于概率邏輯的推理 221
8.1.3 基于規(guī)則的推理 221
8.1.4 基于圖結(jié)構(gòu)的推理 221
8.1.5 基于向量表示的推理 222
8.2 Neo4j圖數(shù)據(jù)科學(xué)GDS 222
8.2.1 圖數(shù)據(jù)科學(xué)GDS的安裝 223
8.2.2 圖數(shù)據(jù)科學(xué)GDS的使用 224
8.3 Python調(diào)用GDS 255
8.3.1 GDS客戶端安裝 255
8.3.2 GDS客戶端使用 256
8.3.3 GDS客戶端API 260
8.4 本章小結(jié) 261
附錄 262