本書旨在為讀者提供一本實用的指南,幫助他們運用現代技術深入探索金融數據領域。
本書以 Python 為主要編程語言,結合實例和 ChatGPT 的協(xié)助,詳細介紹了從獲取金融數據到數據處理、數據可視化、探索、建模,再到機器學習和深度學習等的應用,并且探討了生成式 AI 在選股和分配權重方面的潛在應用,為讀者打開了金融領域未來的一扇新窗。除了提供全面的理論知識
和實用技術指導,本書還附贈了大量高質量的金融數據,可供讀者在不方便調用接口時下載和使用。
本書主要面向金融從業(yè)人員,或者對金融和數據分析感興趣的讀者。
親愛的讀者朋友,非常感謝您選擇本書!在這里,我想和大家聊一聊這本書的寫作背景、寫作過程以及價值。
有那么一段時間,一些從事金融工作的朋友時不時向我抱怨,他們需要在繁忙的工作之余學習編程語言,以便更好地處理和分析金融數據。我深知這種挑戰(zhàn)非常困難,因此,寫這本書的初衷是幫助金融從業(yè)者快速掌握 Python 在金融數據分析中的應用技能,減輕他們的工作負擔。而隨著 AI技術的飛速發(fā)展,AI 大模型的出現為這一目標的實現提供了前所未有的可能性。
AI 大模型,如 ChatGPT,以及以文心一言、訊飛星火認知大模型等為代表的國產大模型等,
都具有強大的自然語言處理能力,可以根據用戶的自然語言提示生成相應的代碼。這一特性使得
金融從業(yè)人員只需有一點編程基礎,就可以通過簡單的自然語言描述,快速生成用于數據分析的
Python 代碼。這無疑極大地降低了數據分析的門檻,讓更多的人能夠輕松地掌握這一技能。
當然,要使用 AI 大模型生成 Python 代碼,高質量的提示詞至關重要。在寫作本書的過程中,我也不斷嘗試調整提示詞,以便讓 AI 大模型生成的代碼能夠順利運行并實現我所期待的結果。通過持續(xù)實驗,我總結出一些經驗和大家進行分享。
首先,我們要明確想要 AI 大模型生成的代碼實現什么功能,是進行數據清洗、特征工程、模型訓練,還是進行預測?我們要確保提示詞清晰地描述了這一目標。
其次,對于重要的步驟和邏輯,提供足夠的細節(jié)。例如,如果我們想生成一段用于數據分區(qū)的代碼,可以這樣寫:請將數據集分為訓練集和測試集,比例為 70% 和 30%。
再次,我們要確保提示詞沒有歧義,以免導致生成的代碼不符合預期。例如,不要簡單地寫生成一個循環(huán),而要明確循環(huán)的次數、條件等細節(jié)。
最后,我們要確保使用正確的專業(yè)詞匯,從而讓 AI 大模型更準確地理解我們的需求,并提高代碼的質量。
需要強調的是,在每次生成代碼之后,都要進行測試,確保其滿足我們的需求。根據測試結果,對提示詞進行微調,逐步優(yōu)化生成的代碼。
舉個例子,假設我們想生成一段用于計算股票收益率的 Python 代碼,可以這樣寫提示詞:請
編寫一個 Python 腳本,從 CSV 文件中的收盤價列讀取股票的價格數據,計算每日收益率,并將結果保存為新的 CSV 文件。這樣的提示詞既明確了目標(計算收益率并保存結果),也提供了足夠的細節(jié)(從 CSV 文件中的特定列讀取價格數據、計算每日收益率等)。
寫出高質量的提示詞需要一定的經驗積累。通過不斷測試和反饋,相信大家很快就能夠熟練地運用這一技能,快速獲得滿足需求的 Python 代碼。
本書將手把手教讀者利用精確詳細的提示詞,讓大語言模型生成可用性極高的金融數據分析與建模代碼。此外,本書不僅僅涉及經典的金融數據分析理論與模型,還引入了目前大語言模型在投資組合選股方面的最新研究,旨在幫助讀者拓寬視野,為適應 AI 時代的工作方法打下基礎。
在編寫本書的過程中,我深感責任重大,所以試圖竭盡所能地為讀者呈現最全面實用的知識,
但由于計算機技術發(fā)展迅速,書中難免有疏漏和不妥之處,敬請廣大讀者不吝指正。如果大家在學習過程中遇到問題,歡迎添加我的個人微信dynhyper,我將盡力為大家進行解答。
本書贈送全書案例源代碼及相關數據資源,讀者可掃描下方二維碼關注博雅讀書社微信公眾號,輸入本書 77 頁的資源下載碼,即可獲得本書的下載學習資源。
最后,衷心祝愿讀者朋友在金融數據分析領域取得更大的成就,實現自己的職業(yè)發(fā)展目標。同
時,也讓我們一起迎接 AI 大模型帶來的新挑戰(zhàn)與新機遇,共同邁向數據驅動的新未來!
段小手
第1章
用Python獲取金融數據/ 1
1.1獲取股票數據2
1.1.1獲取股票實時行情數據2
1.1.2獲取股票歷史行情數據4
1.1.3獲取上市公司財務指標數據.5
1.2獲取期貨數據8
1.2.1獲取期貨手續(xù)費與保證金數據8
1.2.2獲取期貨實時行情數據10
1.2.3獲取期貨歷史行情數據11
1.3獲取宏觀數據12
1.3.1獲取國內生產總值數據12
1.3.2獲取社會融資規(guī)模增量統(tǒng)計數據14
1.3.3獲取M2貨幣供應年率數據.15
1.4小結與習題.15
第2章
讓ChatGPT協(xié)助處理金融數據/ 17
2.1將價格數據轉化為收益.18
2.1.1讓ChatGPT協(xié)助計算簡單收益18
2.1.2讓ChatGPT協(xié)助計算對數收益20
2.2根據通貨膨脹調整收益.21
2.2.1通貨膨脹調整的一般步驟.22
2.2.2獲取CPI月率數據并進行處理.23
2.2.3讓ChatGPT協(xié)助進行通貨膨脹調整24
2.3實現波動率的計算.26
2.3.1實現波動率的原理與公式.26
2.3.2計算股價的月度實現波動率.27
2.3.3讓ChatGPT協(xié)助計算年化實現波動率28
2.4缺失數據填補31
2.4.1用reindex填補缺失的日期.31
2.4.2讓ChatGPT協(xié)助填充缺失數據32
2.4.3讓ChatGPT協(xié)助用插值法填充缺失數據33
2.5小結與習題.35
......
第15章
利用生成式AI進行選股和分配權重 311
15.1生成式AI用于投資組合選擇的研究312
15.1.1生成式AI與其幻覺312
15.1.2生成式AI與大語言模型314
15.2使用大語言模型薦股.315
15.2.1領先基金的投資原則315
15.2.2宏觀經濟形勢分析.317
15.2.3根據經濟形勢研判進行股票選擇319
15.3為投資組合分配權重.323
15.3.1 ChatGPT提供的權重分配323
15.3.2使用傳統(tǒng)優(yōu)化方法計算權重分配326
15.3.3文心一言提供的權重分配.328
15.4小結與習題.332
結束語/ 333