本書全面探討了科技文本分析的智能方法,以情報學(xué)理論為支撐,以人工智能技術(shù)為核心,結(jié)合現(xiàn)代情報工程的前沿實踐經(jīng)驗,對科技文本分析的任務(wù)圖景、智能方法實現(xiàn)以及技術(shù)發(fā)展趨勢進行了系統(tǒng)研究。首先分析了科技文本分析的概念、任務(wù)、實現(xiàn)流程和發(fā)展歷史,系統(tǒng)性地提出了科技文本分析的任務(wù)圖景。其次,深入論述科技文獻的智能化版式分析方法、科技文本結(jié)構(gòu)分析的智能方法、科技文本詞匯功能分析的智能方法、科技文本中科技知識要素分析的智能方法,以及科技文本中引用片段的功能分析。再次,論述了科技文本中的科學(xué)機理識別、科技文本大模型等前沿課題,并簡要分析科技文本中的偏見識別與環(huán)節(jié)、多模態(tài)科技文本分析等高階任務(wù)。最后,分析了科技文本分析智能方法的發(fā)展趨勢。
程齊凱,武漢大學(xué)副教授,博導(dǎo),智能與創(chuàng)新治理研究所所長,長期從事情報分析、文本挖掘研究,主持自科面上項目等項目8項;發(fā)表SSCI、SCI、CSSCI及以上論文70余篇;獲教育部高等學(xué)?茖W(xué)研究優(yōu)秀成果獎二等獎在內(nèi)省部級獎勵8次。
馬永強,博士,講師,畢業(yè)于武漢大學(xué)信息管理學(xué)院,師從陸偉教授。研究方向為智能情報技術(shù)、科技文本挖掘,在IP&M、ESWA、情報學(xué)報及ACL等期刊、會議發(fā)表論文十余篇,被引兩百余次,相關(guān)研究成果在業(yè)內(nèi)多次成功落地應(yīng)用。
導(dǎo)言/001 第一章 科技文本與科技文本分析/005 一 基礎(chǔ)概念/005 二 科技文本的模態(tài)類型與結(jié)構(gòu)層級/009 三 科技文本分析的任務(wù)體系/015 四 科技文本分析面臨的難題/025 五 走向智能化的科技文本分析技術(shù)/029 六 本章小結(jié)/033 第二章 科技文本中蘊含的知識體系/034 一 通用知識類型劃分/035 二 本體視角下的科技文本知識類型/037 三 科技文本知識的本體類型域/045 四 文本結(jié)構(gòu)視角下的科技文本知識體系/047 五 本章小結(jié)/057 第三章 第一性原理視角下的科技文本智能分析/059 一 科技文本分析的認識論觀點/060 二 從認識論觀點到方法論觀點/064 三 本章小結(jié)/068 第四章 科技文獻的版式識別/069 一 科技文獻版式分析的任務(wù)和方法/069 二 科技文獻圖表分析的任務(wù)和方法/079 三 基于動態(tài)版式數(shù)據(jù)集生成的版式分析方法/083 四 交互式科技文獻圖表細粒度理解/090 五 本章小結(jié)/110 第五章 科技文本的結(jié)構(gòu)功能分析/112 一 科技文本結(jié)構(gòu)功能的定義與任務(wù)/112 二 科技文本結(jié)構(gòu)功能的自動識別方法/117 三 科技文本的結(jié)構(gòu)功能識別/121 四 本章小結(jié)/136 第六章 科技文本的詞匯功能分析/137 一 科技文本詞匯功能分析的任務(wù)定義/137 二 科技文本詞匯功能識別的低成本實現(xiàn)方法/142 三 科技文本詞匯功能識別的預(yù)訓(xùn)練語言模型方法/156 四 本章小結(jié)/163 第七章 科技文本的科技知識要素分析/165 一 科技知識要素的類型/165 二 科技知識要素識別的一般方法與實現(xiàn)/168 三 面向設(shè)備計量的設(shè)備概念識別與分析/174 四 本章小結(jié)/180 第八章 科技文本的引用片段識別及引用功能分析/181 一 科技文本引用功能分析的任務(wù)定義/182 二 科技文本引用片段定位/184 三 科技文本引用片段引用動機識別/190 四 超越文檔粒度的知識要素引用網(wǎng)絡(luò)構(gòu)建與分析/194 五 本章小結(jié)/201 第九章 科技文本的科學(xué)機理識別與表示/203 一 科學(xué)機理抽取的任務(wù)定義/204 二 科學(xué)機理的表示方法/208 三 科技機理抽取數(shù)據(jù)集的構(gòu)建/213 四 基于預(yù)訓(xùn)練語言模型的科學(xué)機理抽取方法/216 五 科學(xué)機理文本的檢索與應(yīng)用/222 六 本章小結(jié)/227 第十章 科技文本大模型的構(gòu)建與應(yīng)用/228 一 科技文本大模型的通用能力體系/229 二 科技文本大模型的痛點、問題與方向/232 三 可信可靠科技文本大模型的構(gòu)建思路/237 四 超越下一詞預(yù)測的科技文本大模型/249 五 本章小結(jié)/267 參考文獻/268