自然語(yǔ)言處理入門(mén)與實(shí)戰(zhàn)
定 價(jià):49.8 元
- 作者:徐鵬、張良均
- 出版時(shí)間:2025/8/1
- ISBN:9787121511776
- 出 版 社:電子工業(yè)出版社
- 中圖法分類(lèi):TP391
- 頁(yè)碼:
- 紙張:膠版紙
- 版次:
- 開(kāi)本:16開(kāi)
本教材將Python自然語(yǔ)言處理的常用技術(shù)與真實(shí)案例相結(jié)合,深入淺出地介紹Python自然語(yǔ)言處理的重要內(nèi)容。全書(shū)共8章,主要分為兩大部分,第1~3章為基礎(chǔ)篇,包括導(dǎo)論、文本基礎(chǔ)處理、文本預(yù)處理與分析,第4~8章為實(shí)踐篇,包括新聞自動(dòng)分類(lèi)、天問(wèn)一號(hào)事件用戶評(píng)論情感分析、游客景區(qū)印象分析、論文標(biāo)題自動(dòng)生成,以及基于TipDM大數(shù)據(jù)挖掘建模平臺(tái)的游客景區(qū)印象分析。本教材每章都包含課后習(xí)題,通過(guò)練習(xí)和操作實(shí)踐,幫助讀者鞏固所學(xué)的內(nèi)容。 本教材可以作為高校數(shù)據(jù)科學(xué)或人工智能等相關(guān)專(zhuān)業(yè)的教材,也可作為自然語(yǔ)言處理愛(ài)好者的自學(xué)用書(shū)。
徐鵬,嶺南師范學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院副教授。為本科生講授高級(jí)語(yǔ)言程序、Java語(yǔ)言程序設(shè)計(jì)等多門(mén)課程,獲得校級(jí)教研項(xiàng)目立項(xiàng)1項(xiàng)。主持校級(jí)實(shí)驗(yàn)教學(xué)示范中心項(xiàng)目1項(xiàng)并順利結(jié)題。參與省級(jí)精品課常微分方程建設(shè),出版教材一部。
基礎(chǔ)篇
第1章 導(dǎo)論002
1.1 自然語(yǔ)言處理概述003
1.1.1 發(fā)展歷程及未來(lái)展望003
1.1.2 研究?jī)?nèi)容與常見(jiàn)應(yīng)用003
1.1.3 自然語(yǔ)言處理的基本流程005
1.2 自然語(yǔ)言處理的開(kāi)發(fā)環(huán)境007
1.2.1 Python的優(yōu)勢(shì)007
1.2.2 自然語(yǔ)言處理開(kāi)發(fā)環(huán)境配置008
1.3 自然語(yǔ)言與大語(yǔ)言模型013
本章小結(jié)015
課后習(xí)題015
第2章 文本基礎(chǔ)處理016
2.1 文本數(shù)據(jù)源017
2.2 語(yǔ)料庫(kù)017
2.2.1 語(yǔ)料庫(kù)的類(lèi)型018
2.2.2 語(yǔ)料庫(kù)的用途019
2.2.3 語(yǔ)料庫(kù)的構(gòu)建與獲取019
2.3 中文分詞023
2.3.1 常用中文分詞方法023
2.3.2 基于jieba庫(kù)的中文分詞029
2.4 詞性標(biāo)注與命名實(shí)體識(shí)別031
2.4.1 詞性標(biāo)注簡(jiǎn)介與規(guī)范031
2.4.2 命名實(shí)體識(shí)別簡(jiǎn)介與常用算法033
2.4.3 基于jieba庫(kù)的詞性標(biāo)注與命名實(shí)體識(shí)別035
2.5 關(guān)鍵詞提取037
2.5.1 常用關(guān)鍵詞提取算法037
2.5.2 提取文本關(guān)鍵詞039
本章小結(jié)043
課后習(xí)題043
第3章 文本預(yù)處理與分析045
3.1 文本向量化與相似度046
3.1.1 文本向量化與相似度簡(jiǎn)介046
3.1.2 常用文本向量化方法047
3.1.3 文本向量化實(shí)現(xiàn)055
3.1.4 常用文本相似度算法057
3.1.5 文本相似度算法實(shí)現(xiàn)060
3.2 文本分析簡(jiǎn)介062
3.2.1 結(jié)構(gòu)化分析062
3.2.2 語(yǔ)義化分析064
3.3 文本分析常用算法065
3.3.1 常用機(jī)器學(xué)習(xí)算法065
3.3.2 常用深度學(xué)習(xí)算法070
本章小結(jié)076
課后習(xí)題076
實(shí)踐篇
第4章 新聞?lì)愋妥詣?dòng)分類(lèi)080
4.1 業(yè)務(wù)背景與項(xiàng)目目標(biāo)081
4.1.1 業(yè)務(wù)背景081
4.1.2 數(shù)據(jù)說(shuō)明081
4.1.3 分析目標(biāo)082
4.2 分析方法與過(guò)程082
4.2.1 數(shù)據(jù)采集083
4.2.2 數(shù)據(jù)探索083
4.2.3 文本預(yù)處理088
4.2.4 構(gòu)建SVM模型092
4.2.5 模型評(píng)估095
本章小結(jié)096
課后習(xí)題097
第5章 天問(wèn)一號(hào)事件用戶評(píng)論情感分析098
5.1 業(yè)務(wù)背景與項(xiàng)目目標(biāo)099
5.1.1 業(yè)務(wù)背景099
5.1.2 數(shù)據(jù)說(shuō)明099
5.1.3 分析目標(biāo)100
5.2 分析方法與過(guò)程101
5.2.1 數(shù)據(jù)探索101
5.2.2 文本預(yù)處理106
5.2.3 繪制詞云圖110
5.2.4 模型構(gòu)建與訓(xùn)練114
5.2.5 模型評(píng)估119
5.2.6 模型優(yōu)化121
本章小結(jié)126
課后習(xí)題126
第6章 游客景區(qū)印象分析127
6.1 業(yè)務(wù)背景與項(xiàng)目目標(biāo)128
6.1.1 業(yè)務(wù)背景128
6.1.2 數(shù)據(jù)說(shuō)明128
6.1.3 分析目標(biāo)129
6.2 分析方法與流程130
6.2.1 文本預(yù)處理130
6.2.2 景區(qū)印象分析133
6.2.3 景區(qū)特色分析134
6.2.4 提升景區(qū)美譽(yù)度的建議140
本章小結(jié)141
課后習(xí)題141
第7章 論文標(biāo)題自動(dòng)生成142
7.1 業(yè)務(wù)背景與項(xiàng)目目標(biāo)143
7.1.1 業(yè)務(wù)背景143
7.1.2 數(shù)據(jù)說(shuō)明144
7.1.3 分析目標(biāo)144
7.2 分析方法與流程145
7.2.1 文本預(yù)處理145
7.2.2 訓(xùn)練模型148
7.2.3 結(jié)果與分析154
本章小結(jié)156
課后習(xí)題156
第8章 基于TipDM大數(shù)據(jù)挖掘建模平臺(tái)的游客景區(qū)印象分析157
8.1 TipDM大數(shù)據(jù)挖掘建模平臺(tái)簡(jiǎn)介158
8.1.1 共享庫(kù)159
8.1.2 數(shù)據(jù)連接159
8.1.3 數(shù)據(jù)集160
8.1.4 我的工程160
8.1.5 個(gè)人組件163
8.2 使用平臺(tái)實(shí)現(xiàn)游客景區(qū)印象分析164
8.2.1 使用平臺(tái)實(shí)現(xiàn)游客景區(qū)印象分析的總體流程164
8.2.2 配置數(shù)據(jù)源165
8.2.3 文本預(yù)處理167
8.2.4 景區(qū)印象分析171
8.2.5 景區(qū)特色分析174
本章小結(jié)177
課后習(xí)題178
參考文獻(xiàn)179