本書面向政務服務精準化,以政策內容挖掘與價值作用發(fā)揮的研究脈絡為主線,基于深度學習和自然語言理解等技術,從政策文本結構化解析、自動摘要生成以及政策文本精準推送三個層面,系統(tǒng)研究了其中的理論基礎、技術方案和實證優(yōu)化策略。本書研究探索了從“政策文本信息處理”到“政策主旨內涵把握”的理論框架和技術方案,拓展了政策文本挖掘與理解研究的深度和范疇,創(chuàng)新了政策文本研究的理論與方法體系。
更多科學出版社服務,請掃碼獲取。
200309-200706 武漢大學 電子商務 本科、學士
200709-201206 武漢大學 信息資源管理(碩博連讀) 研究生、博士201206-201408 武漢大學 師資博士后
201211-201602 武漢大學 講師
201508-201608 美國肯特州立大學 訪問學者
201602-202111 武漢大學 副教授
202111-至今 武漢大學 教授
202303-至今 國家自然科學基金委員會 流動項目主任信息資源管理1. 作為通訊作者、第一作者發(fā)表論文99篇,其中SCI檢索10篇、SSCI檢索18篇、EI檢索1篇,CSSCI檢索61篇、其他核心期刊檢索4篇。
2. 代表性論文
Hu Jiming, Yang Zexian, Wang JiaMin, et al. Examining the Structure of MPs in the UK-China Relationship using Speech-Word Pair Bipartite Networks[J]. Aslib Journal of Information Management, 2024.3(SCI/SSCI ,IF:2.5,JCR2區(qū))
Yang Jinqing, Lu Wei, Hu Jiming*, et al. A novel emerging topic detection method: A knowledge ecology perspectives[J]. Information Processing & Management, 2022,59(2):102843.(SCI/SSCI,IF:7.3,JCR1區(qū))
Lu Wei,
目錄
第1章 政策文本研究進展與挖掘方案設計 1
1.1 政策文本研究的脈絡梳理 1
1.2 政策文本深度挖掘與應用研究方案 12
1.3 政策文本深度挖掘與應用研究的價值 15
第2章 面向主題挖掘的政策文本結構化解析 16
2.1 跨學科支撐下的政策文本結構化分析 16
2.2 政策文本結構化解析的研究方案 33
2.3 政策文本結構化解析框架與技術路線 36
2.4 政策文本結構化解析的技術應用 46
2.5 總結與展望 60
第3章 基于多維特征融合的政策文本語義增強表示 63
3.1 融合多維特征的政策文本表示方案 63
3.2 政策主題挖掘與文本向量生成 65
3.3 政策文本中的實體特征提取 68
3.4 基于預訓練語言模型的政策文本增強表示 77
3.5 總結與展望 83
第4章 政策文本生成式摘要模型構建與技術實現(xiàn) 86
4.1 面向深層次挖掘的政策文本摘要生成研究 86
4.2 政策文本摘要生成的研究方案 97
4.3 面向摘要生成的政策文本關鍵語句抽取 105
4.4 基于依存句法的政策文本摘要生成模型 112
4.5 融合PGN 的政策文本摘要生成優(yōu)化 122
4.6 領域政策文本摘要生成實證研究 128
4.7 總結與展望 141
第5章 政策文本精準推送模型構建與技術實現(xiàn) 145
5.1 政府文本精準推送研究的背景與價值 145
5.2 政策文本推送研究的發(fā)展趨勢 149
5.3 政策文本精準推送的研究方案 157
5.4 基于多維特征的政策用戶畫像生成 162
5.5 基于特征聚類的政策推送關系標注 167
5.6 基于特征注意力的政策文本精準推送模型 171
5.7 政策精準推送實證研究 173
5.8 總結與展望 194
圖目錄
圖1-1 研究內容設計 12
圖2-1 政策文本結構化解析研究方案 33
圖2-2 基于框架語義的結構化語義框架 40
圖2-3 結構化解析框架搭建思路 41
圖2-4 LDA2Vec主題抽取模型 44
圖2-5 LDA主題模型 45
圖2-6 政策發(fā)文機構統(tǒng)計 55
圖2-7 政策主題統(tǒng)計 56
圖2-8 典型案例政策引用關系圖 57
圖3-1 融合多維特征的政策文本向量表示方案 64
圖3-2 政策主題挖掘與文本向量生成框架 65
圖3-3 基于LDA模型的政策文本主題挖掘結構 66
圖3-4 基于主題分布的文本向量生成 68
圖3-5 BiLSTM-CRF政策實體識別模型 72
圖3-6 LSTM單元結構 72
圖3-7 LSTM鏈式結構 74
圖3-8 BiLSTM網絡結構 74
圖3-9 CRF模型 74
圖3-10 BERT模型結構圖 78
圖3-11 無監(jiān)督的SimCSE模型 81
圖3-12 PV-DM 結構 82
圖4-1 政策文本摘要生成研究內容 100
圖4-2 政策文本摘要生成研究策略 103
圖4-3 基于深度學習的政策文本摘要生成研究框架 104
圖4-4 基于句向量改進的政策文本關鍵句子抽取策略 106
圖4-5 基于句子重要性分數(shù)計算的政策文本關鍵句子抽取流程 106
圖4-6 基于依存句法的生成式政策文本自動摘要模型 113
圖4-7 政策文本依存句法樹示例 115
圖4-8 依存句法樹對應的鄰接矩陣 116
圖4-9 圖卷積操作示例 118
圖4-10 基于Seq2Seq的政策文本自動摘要模型 121
圖4-11 融合PGN的政策文本自動摘要模型 124
圖4-12 政策文本摘要評分模型 126
圖4-13 政策文本采集結果示例 130
圖4-14 政策文本摘要數(shù)據(jù)集平均字數(shù)分布情況 133
圖4-15 不同政策文本摘要生成模型ROUGE 指標分數(shù)柱狀圖 137
圖5-1 政策文本精準推送研究框架 161
圖5-2 政策用戶畫像的指標體系結構圖 165
圖5-3 政策用戶特征交集 169
圖5-4 政策及用戶推送關系標注 170
圖5-5 基于深度神經網絡的政策推送模型 172
圖5-6 YEDDA標注示例 178
圖5-7 助殘政策詞向量 184
圖5-8 助殘政策用戶畫像指標體系結構圖 186
圖5-9 基于殘疾人特征的用戶聚類 189
表目錄
表2-1 政策文本通用特征 42
表2-2 政策主題-詞分布 46
表2-3 政策文本結構化解析通用框架 46
表2-4 “互聯(lián)網+”政策外部屬性特征表 49
表2-5 LDA主題抽取詞組表 50
表2-6 Doc2Vec模型參數(shù)設置 50
表2-7 “互聯(lián)網+”政策文本結構化解析框架 51
表2-8 案例文本主題-文檔距離值表 52
表2-9 《國務院辦公廳關于促進“互聯(lián)網+醫(yī)療健康”發(fā)展的意見》結構化解析框架 52
表2-10 被引用政策數(shù)量統(tǒng)計(部分) 58
表3-1 政策實體類別 71
表3-2 實體標簽概率分布 75
表4-1 政策文本線索詞表 110
表4-2 LTP 句法依存關系類型 115
表4-3 政策文本數(shù)據(jù)采集信息 129
表4-4 不同的政策文本關鍵句子抽取方法結果對比 131
表4-5 政策文本摘要數(shù)據(jù)集單條數(shù)據(jù)示例 132
表4-6 本地機器與Mist 服務器環(huán)境配置 135
表4-7 摘要生成模型參數(shù)設置 135
表4-8 不同政策文本摘要生成模型結果對比 136
表4-9 不同政策文本摘要生成模型結果呈現(xiàn) 139
表5-1 殘疾人政策來源(1952 年至2021 年) 175
表5-2 殘疾人數(shù)據(jù)字段及描述說明 177
表5-3 助殘政策中五類實體統(tǒng)計 179
表5-4 命名實體識別模型參數(shù)設置 179
表5-5 不同類型實體識別評價結果 180
表5-6 不同模型識別結果對比 181
表5-7 助殘政策實體信息表(節(jié)選) 181
表5-8 助殘政策主題 182
表5-9 助殘政策文本基礎向量 183
表5-10 殘疾人用戶向量化示例 187
表5-11 助殘政策推送關系表 190
表5-12 助殘政策推送模型推送準確率 192
表5-13 助殘政策推送結果(政策-用戶向) 193
表5-14 助殘政策推送結果(用戶-政策向) 193