定 價:56 元
叢書名:數字中國·數字經濟創(chuàng)新規(guī)劃教材
- 作者:熊鵬,高華聲,皮旭庭,陳劍 著
- 出版時間:2025/7/1
- ISBN:9787301364161
- 出 版 社:北京大學出版社
- 中圖法分類:F830.49
- 頁碼:216
- 紙張:
- 版次:1
- 開本:16開
本書系統介紹了大語言模型的技術原理,及其在金融領域的實踐應用,為讀者呈現人工智能技術與金融深度融合的全景圖。
技術基礎部分,深入淺出地介紹了從傳統TF-IDF到Transformer架構的演進過程、BERT與GPT的技術異同、GPT系列從監(jiān)督微調到零樣本學習的范式轉變等內容,并針對大語言模型的“幻覺”問題提出系統的評估和應對策略。
實踐應用部分,展示了豐富的大語言模型金融場景應用案例,包括財報分析、情緒分析、選股策略等,詳細介紹了美聯儲情緒指數的構建方法,以及提示工程和檢索增強生成等關鍵技術。最后以文獻綜述形式,探討大語言模型如何賦能金融學研究。
本書內容翔實,結構清晰,不僅蘊含堅實的理論基礎,還提供了具有可復制性的實踐案例,可作為高等學校金融學、數學經濟及相關專業(yè)教材,也可作為金融從業(yè)者,研究人員的參考書。同時配有豐富數字資源,包括進階版拓展閱讀資料,以及教學課件等,讀者可按書后提示獲取相關資源。
熊鵬,全球宏觀交易員,比特熊AI創(chuàng)始人,CCER中國證券市場數據庫創(chuàng)始人,深交所投資時鐘指數發(fā)明人,臥虎藏龍交易員訓練營創(chuàng)始人,GBCI全球經濟周期指數發(fā)明人,成都復旦西部國際金融研究院研究員。先后在金融學、經濟學國際期刊發(fā)表多篇論文。他和他的團隊專注于AI垂直行業(yè)應用,推出全棧AI智能體框架和落地運用,在農業(yè)、金融、法律、出版和醫(yī)療等多個領域取得突破性進展,具有豐富的AI項目落地實踐經驗。
高華聲,復旦大學國際金融學院教授、博士生導師、黨總支副書記副院長,成都復旦西部國際金融研究院副院長。致力于科技創(chuàng)新、金融大語言模型應用、公司金融的研究,先后在金融學、會計學、管理學經濟學國際期刊發(fā)表論文30多篇,研究成果多次被The Wall Street Journal、The New YorkTimes等媒體報道,并入選美國斯坦福大學發(fā)布的全球前2%科學家和愛思唯爾中國高被引學者。
皮旭庭,美國加利福尼亞大學戴維斯分校(UC Davis)計算物理博士。求學期間專注于物理計算方法的算法開發(fā)以及機器學習在物理領域的應用研究;畢業(yè)后先后于加利福尼亞大學爾灣分校(UC Irvine)與加利福尼亞大學戴維斯分校擔任博士后研究員;此后轉任硅谷多家網絡科技公司資深科學家等職務。目前主要從事自然語言處理、半監(jiān)督學習、貝葉斯方法與大語言模型等領域的研究與應用,發(fā)表近30篇學木論文與專利。
陳劍,復旦大學國際金融學院金融學實踐教授,成都復旦西部國際金融研究院研究員,教授“房地產金融”“結構化金融”“金融中的機器學習和人工智能”等課程。信風金融科技創(chuàng)始人兼CEO,財新智庫高級業(yè)務顧問,中國資產證券化論壇信息披露專委會主席。
第1章金融大語言模型:新興交叉學科的誕生
1. 1 大語言模型的前世今生 ……………………………………… 2
1. 2 當金融遇見大語言模型 ……………………………………… 4
1. 3 金融大語言模型對傳統人工智能的突破 …………………… 8
1. 4 金融大語言模型可能的風險點 ……………………………… 9
第 2 章 認識自然語言處理 ∥ 12
2. 1 什么是自然語言處理 ………………………………………… 13
2. 2 最簡單的編碼模型:TF-IDF文本向量 ……………………… 14
2. 3 潛在語義分析 ………………………………………………… 16
2. 4 敲開自監(jiān)督預訓練的大門:Word2Vec ……………………… 18
2. 5 基于上下文的編碼模型:ELMo …………………………… 22
2. 6 NLP的典范轉移者:Transformer …………………………… 24
2. 7 大語言模型的先鋒:BERT與GPT ………………………… 29
第 3 章 生成式大語言模型 ∥ 34
3. 1 GPT-1:用微調來解決下游任務 ……………………………… 36
3. 2 GPT-2:用零樣本學習來解決下游任務 …………………… 37
3. 3 GPT-3:用少樣本學習來解決下游任務 …………………… 38
3. 4 InstructGPT…………………………………… 39
3. 5 涌現現象 ……………………………………………………… 40
第 4 章 提示工程 ∥ 45
4. 1 什么是提示工程 ……………………………………………… 46
4. 2 魔法咒語與超能力 …………………………………………… 46
4. 3 上下文學習 …………………………………………………… 48
4. 4 思維鏈 ………………………………………………………… 52
4. 5 檢索增強生成 ………………………………………………… 55
第 5 章 大語言模型中的幻覺問題 ∥ 61
5. 1 什么是幻覺 …………………………………………………… 63
5. 2 幻覺的類型 …………………………………………………… 64
5. 3 幻覺的利弊 …………………………………………………… 65
5. 4 幻覺的成因 …………………………………………………… 66
5. 5 如何評估幻覺 ………………………………………………… 69
5. 6 幻覺的檢測 …………………………………………………… 71
5. 7 減少幻覺的手段 ……………………………………………… 73
第 6 章 大語言模型在金融領域的應用 ∥ 76
6. 1 大語言模型財務報告分析 …………………………………… 78
6. 2 社交媒體平臺上個人投資者的“群智”分析 ……………… 84
6. 3 大語言模型選股 ……………………………………………… 88
6. 4 大語言模型解讀分析師報告中的企業(yè)文化 ……………… 92
第7章金融大語言模型的數據基礎
7. 1 金融大語言模型總體架構 …………………………… 103
7. 2 金融原始數據和數據預處理 ……………………………… 103
7. 3 BloombergGPT和FinGPT 的介紹及對比…………………… 112
第8章 利用大語言模型對金融信息進行深度分析 ∥118
8. 1 大語言模型的一般用途 …………………………………… 120
8. 2 用大語言模型深度分析英偉達財報電話會議 …………… 128
8. 3 對長文本進行關鍵詞提取和摘要 ………………………… 133
8. 4 跟蹤分析師對英偉達的觀點變化 …………………… 137
8. 5 比較美聯儲會議紀要 ……………………………………… 140
8. 6 大語言模型分析和建立美聯儲情緒指數 ………………… 143
第 9 章 檢索增強生成與股票分析系統 ∥ 153
9. 1 檢索增強生成詳解 ………………………………………… 154
9. 2 RAG應用案例:出口限制對英偉達營收的影響…………… 161
9. 3 AutoGen初步:RAG和股票分析 …………………………… 165
第 10 章 微調大模型 ∥ 178
10. 1 微調大模型的挑戰(zhàn) ………………………………………… 180
10. 2 Unsloth 項目介紹…………………………………………… 180
10. 3 微調 Llama 3 中國宏觀經濟分析大模型 ………………… 183
第 11 章 大語言模型與金融學研究交叉前沿 ∥ 192
11. 1 大語言模型在金融學研究中的主要應用方向 …………………… 193
11. 2 基于文本變量的構建效度 ……………………………… 200
11. 3 在金融學研究中使用大語言模型的指南 ……………… 203