CCF 2024中國計算機科學技術發(fā)展報告 大模型篇 中國計算機學會
定 價:169 元
- 作者:中國計算機學會
- 出版時間:2025/8/1
- ISBN:9787111786917
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
本書充分體現了對大模型技術發(fā)展中的新問題、前沿技術、交叉融合的思考,主要內容包括:大語言模型理論的研究進展與趨勢、領域大模型的研究進展與趨勢、大模型下的軟件工程研究進展與趨勢、數據準備與語言模型交叉技術的研究進展及發(fā)展趨勢、大模型基礎軟件的研究進展與趨勢、大模型時代智能音頻信號處理的研究進展與趨勢、大語言模型價值對齊的研究進展與趨勢,以及基于大模型的智能體的理論、關鍵技術與展望。內容具有權威性、全面性和前沿性。 本書主要供中國計算機學會會員了解2024年計算機大模型技術發(fā)展的最新動態(tài),也非常適合計算機學者和從業(yè)者閱讀與收藏。
適讀人群 :計算技術及相關領域從業(yè)者 ◆中國計算機學會文集 ◆記錄和見證中國大模型領域的發(fā)展 ◆展現中國大模型技術及相關領域的研究進展 ◆完整地認知新時期面臨的挑戰(zhàn)和機遇
計算機及其相關網絡基礎設施已經成為人類信息社會的重要基石,計算技術發(fā)展水平也成為衡量國家發(fā)展水平和競爭力的重要指標!吨袊嬎銠C科學技術發(fā)展報告》(簡稱《發(fā)展報告》)記錄和見證了中國計算機領域的發(fā)展,所涉及的內容涵蓋計算技術的諸多重要領域,展現了我國計算技術及相關領域的研究進展,可以幫助讀者更完整地認識新時期面臨的挑戰(zhàn)和機遇,并指出新的開拓領域和方向。這幾年大模型的研究和應用蓬勃發(fā)展,大語言模型、視覺大模型、多模態(tài)大模型取得了性能上的突破,在各行各業(yè)產生了廣泛的影響。2024年的學科發(fā)展報告尤其體現了這一趨勢:無論是在提出申請的報告還是在最終入選的報告中,大模型主題在數量上遙遙領先,主題覆蓋了大模型理論、基礎軟件、智能體、安全、領域大模型和多模態(tài)大模型等。大模型的發(fā)展將推動上下游產業(yè)鏈如芯片、基礎軟件、高性能計算、計算機應用等方面的快速發(fā)展,給整個計算機行業(yè)帶來新的變革和機遇。本年度《發(fā)展報告》的組織和策劃工作得到了中國計算機學會各專業(yè)委員會和廣大會員的大力支持與積極響應,共收到32份反映不同方向進展的報告申請。中國計算機學會學術工作委員會組織了多輪評審,遴選出具有代表性的高水平報告共22篇,其中通用領域14篇,大模型相關的8篇。在此,特別向本年度所有發(fā)展報告的執(zhí)筆人表示感謝,也衷心感謝各專業(yè)委員會的主任和秘書的辛勤付出。中國計算機學會孫凝暉理事長、梅宏前理事長、唐衛(wèi)清秘書長等對本報告的整理和出版給予了指導和支持,中國計算機學會學術工作委員會的委員在選題、組織、評審等方面不辭辛勞,學會秘書處協(xié)助處理了繁雜的事務性工作,在此一并表示感謝。陳文光中國計算機學會學術工作委員會主任
劉勇,中國人民大學,長聘副教授,博士生導師,國家級高層次青年人才。長期從事機器學習基礎理論研究,共發(fā)表論文100余篇,其中以第一作者/通訊作者發(fā)表頂級期刊和會議論文近50篇,涵蓋機器學習領域頂級期刊JMLR、IEEE TPAMI、Artificial Intelligence和頂級會議ICML、NeurIPS等。
前言大語言模型理論的研究進展與趨勢CCF人工智能與模式識別專業(yè)委員會1大語言模型理論概述:統(tǒng)計學習視角21.1大語言模型的理論框架21.2大語言模型的表達能力41.3大語言模型的泛化分析41.4大語言模型的優(yōu)化算法62大語言模型的構建原則:理論指導實踐82.1預訓練理論及其啟發(fā)82.2有監(jiān)督微調理論及其啟發(fā)102.3提示工程理論及其啟發(fā)133大語言模型的涌現能力:數學機理分析143.1擴展法則機理分析153.2情境學習能力機理分析173.3思維鏈能力機理分析194結論20參考文獻20作者簡介26領域大模型的研究進展與趨勢CCF人工智能與模式識別專業(yè)委員會1引言282領域大模型的構建流程292.1大模型評測292.2數據準備與設計332.3持續(xù)性知識注入382.4提示工程423領域大模型驅動的應用框架473.1工作流473.2大模型智能體484國內外領域大模型的典型實例544.1醫(yī)療領域554.2金融領域554.3法律領域564.4科研領域564.5商用領域565總結與展望57參考文獻57作者簡介66大模型下的軟件工程研究進展與趨勢CCF軟件工程專業(yè)委員會1引言702軟件工程領域大模型712.1軟件工程領域的基礎大模型722.2基于指令調優(yōu)的軟件工程領域大模型742.3軟件工程領域大模型的評估753大模型輔助軟件工程773.1大模型下的需求與設計773.2大模型下的代碼輔助生成793.3大模型下的軟件測試823.4大模型下的代碼分析與檢視843.5大模型下的軟件運維853.6大模型下的漏洞工程864大模型下的開源生態(tài)884.1大模型加速開源生態(tài)的演進與技術創(chuàng)新884.2大模型使生態(tài)復雜性加劇884.3大模型促進軟件泛在化與生態(tài)擴展895大模型下的軟件工程挑戰(zhàn)915.1整體層面的挑戰(zhàn)915.2具體層面的挑戰(zhàn)925.3軟件工程大模型數據與評估的挑戰(zhàn)995.4軟件工程領域大模型在可信性方面的挑戰(zhàn)1006總結100參考文獻101作者簡介110數據準備與語言模型交叉技術的研究進展及發(fā)展趨勢CCF數據庫專業(yè)委員會1引言1141.1初識基于語言模型的數據準備1151.2初識面向語言模型的數據準備1171.3報告結構1202基于語言模型的數據準備1202.1國內外研究現狀1202.2基于傳統(tǒng)方法的數據準備1212.3基于語言模型的數據發(fā)現1262.4基于語言模型的數據查詢1292.5基于語言模型的數據融合1332.6基于語言模型的數據清洗1363面向語言模型的數據準備1393.1國內外研究現狀1403.2面向預訓練的數據準備1403.3面向指令微調的數據準備1453.4面向模型推理的數據準備1504發(fā)展趨勢與展望1544.1基于語言模型的數據準備發(fā)展趨勢與展望1544.2面向語言模型的數據準備發(fā)展趨勢與展望1575結束語160參考文獻161作者簡介170大模型基礎軟件的研究進展與趨勢CCF系統(tǒng)軟件專業(yè)委員會1引言1722國內外研究和產業(yè)現狀1742.1大模型訓練微調軟件1742.2大模型推理基礎軟件1802.3大模型開發(fā)工具鏈軟件1872.4面向RAG的大模型數據管理基礎軟件1952.5大模型編排軟件2032.6大模型操作系統(tǒng)2083國內學術研究及產業(yè)進展2133.1學術研究進展2133.2產業(yè)結構演化2154我國大模型基礎軟件研究的優(yōu)勢和挑戰(zhàn)2164.1我國大模型基礎軟件研究優(yōu)勢2164.2我國大模型基礎軟件研究面臨的挑戰(zhàn)2175發(fā)展趨勢與展望2185.1大模型訓練框架走向多模態(tài)和異構融合2185.2加速大模型推理從“作詩”走向“作詩+做事”,賦能千行百業(yè)2195.3與平臺特性、模型特征深入融合,大模型開發(fā)工具鏈軟件向領域化發(fā)展2195.4數據管理向多模態(tài)和多層次發(fā)展,與傳統(tǒng)數據存儲系統(tǒng)進一步融合2205.5多智能體編排軟件蓬勃發(fā)展,智能體與傳統(tǒng)軟件加速融合2206結束語221參考文獻222作者簡介233大模型時代智能音頻信號處理的研究進展與趨勢CCF語音對話與聽覺專業(yè)委員會1引言2372音頻表征學習2392.1傳統(tǒng)聲學特征2392.2深度學習表征2402.3自監(jiān)督學習語音表征2413基于大模型的音頻理解任務2463.1按標簽類型分類2463.2按任務類型分類2473.3音頻標簽預測2483.4序列事件檢測2493.5音頻事件檢測2493.6音頻描述2503.7大模型時代的音頻理解2503.8大模型時代的音頻理解評估指標2514基于大模型的音頻生成任務2524.1語音生成大模型2524.2音效生成2544.3音樂生成2555通用音頻大模型進展2575.1通用音頻大模型的3種形式2575.2基于編碼器的通用音頻大模型2585.3基于編碼器-解碼器的通用音頻大模型2615.4基于解碼器的通用音頻大模型2625.5融合其他模態(tài)的通用音頻大模型2665.6通用音頻大模型的數據集建設2676未來研究趨勢展望2687結束語269參考文獻269作者簡介278大語言模型價值對齊的研究進展與趨勢CCF自然語言處理專業(yè)委員會1引言2801.1大語言模型概述2801.2價值對齊的概念與意義2811.3大語言模型的對齊方法與分類2831.4本文的組織形式2832國際研究現狀2842.1整體研究方向與趨勢2842.2價值對齊方法研究2842.3價值對齊評估與可解釋性2893國內研究進展2923.1整體研究方向與趨勢2923.2價值對齊方法研究2933.3價值對齊評估與可解釋性2954國內外研究進展比較2974.1技術路線的共性2974.2技術路線的差異2984.3研究焦點與方法的比較2984.4應用領域與場景對比3005發(fā)展趨勢與展望3015.1挑戰(zhàn)與機遇3015.2研究趨勢與創(chuàng)新方向3035.3對行業(yè)與社會的長遠影響3056結束語307參考文獻307作者簡介315基于大模型的智能體:理論、關鍵技術與展望CCF自然語言處理專業(yè)委員會1引言3181.1智能體的背景介紹3181.2智能體的發(fā)展歷程3181.3基于大模型的智能體的意義3201.4本文的組織安排3202基于大模型的智能體的框架結構3222.1感知模塊3232.2規(guī)劃模塊3242.3記憶模塊3252.4工具使用模塊3273基于大模型的智能體的能力演化路徑3293.1基座模型能力拓展3293.2智能體工作流編排3313.3自主探索與進化3333.4多智能體協(xié)同演化3333.5智能體標桿數據集3344基于大模型的智能體的應用范式3354.1單智能體范式3354.2多智能體協(xié)作范式3364.3人機交互范式3375智能體社會的環(huán)境與行為機制3385.1智能體的社會行為與人格3385.2模擬社會的運行環(huán)境3405.3使用智能體進行社會模擬3426總結和展望344致謝345參考文獻345作者簡介359