書單推薦
更多
新書推薦
更多

深度剖析DeepSeek大模型

深度剖析DeepSeek大模型

定  價:99.9 元

        

當前圖書已被 6 所學校薦購過!
查看明細

  • 作者:丁小晶,崔遠編著
  • 出版時間:2025/3/1
  • ISBN:9787111779223
  • 出 版 社:機械工業(yè)出版社
  • 中圖法分類:TP18 
  • 頁碼:330頁
  • 紙張:
  • 版次:1
  • 開本:24cm
9
7
7
8
7
7
9
1
2
1
2
1
3
全書共分為12章,首先介紹大模型的基礎知識與發(fā)展歷程,從神經網絡的起源到大規(guī)模預訓練模型的演化,再到Transformer、BERT與GPT等模型架構的深入剖析,幫助讀者理解大模型的技術基石。其次詳細解析了DeepSeek-R1及其Zero版本在強化學習與模型架構上的核心技術,包括混合專家模型、動態(tài)學習率調度、分布式訓練及高效推理優(yōu)化策略等。再次聚焦于模型訓練與開發(fā)實踐,介紹API調用、上下文拼接、模型微調、知識蒸餾等關鍵技術,并結合DeepSeek實際案例展示其在數學推理、代碼生成等領域的應用。最后著重探討了大模型在商業(yè)化落地場景中的高級應用,如FIM補全、多輪對話、業(yè)務代碼自動化生成以及基于云部署的智能推薦搜索系統(tǒng)等。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內容