書單推薦
更多
新書推薦
更多

視覺語言模型VLM原理與實戰(zhàn)

視覺語言模型VLM原理與實戰(zhàn)

定  價:99 元

        

當(dāng)前圖書已被 2 所學(xué)校薦購過!
查看明細(xì)

  • 作者:吳建明、吳一昊 編著
  • 出版時間:2025/9/1
  • ISBN:9787122478733
  • 出 版 社:化學(xué)工業(yè)出版社
  • 中圖法分類:TP391 
  • 頁碼:267
  • 紙張:
  • 版次:01
  • 開本:小16開
9
7
4
8
7
7
8
1
7
2
3
2
3

讀者對象:本書系統(tǒng)性與前沿性并重,理論與實踐結(jié)合,非常適合AI算法工程師、大模型及多模態(tài)人工智能研究者學(xué)習(xí),也可用作高等院校相關(guān)專業(yè)的教材及參考書。

本書系統(tǒng)闡述了視覺語言模型的理論體系與技術(shù)實踐。全書共15章,分為三大部分:基礎(chǔ)綜述(第1章)、關(guān)鍵技術(shù)(第2~14章)與未來展望(第15章)。
第一部分詳解視覺語言模型的網(wǎng)絡(luò)架構(gòu)、預(yù)訓(xùn)練目標(biāo)、評估方法及數(shù)據(jù)集體系,對比分析對抗訓(xùn)練、生成式預(yù)訓(xùn)練等范式,并建立性能評估基準(zhǔn)。第二部分:第2章通過多個案例展示技術(shù)多樣性;第3~5章深入探討少樣本學(xué)習(xí)、魯棒微調(diào)等關(guān)鍵問題,提出約束線性探測等原創(chuàng)方法;第6~10章聚焦模型擴展性,涵蓋InternVL億級參數(shù)訓(xùn)練、VinVL視覺表征重構(gòu)等前沿實踐;第11~14章探索提示工程、異常檢測等應(yīng)用場景,包含MATCHER一次性分割等突破性方案。第三部分展望多模態(tài)生成、組合推理等未來方向。
本書系統(tǒng)性與前沿性并重,理論與實踐結(jié)合,非常適合AI算法工程師、大模型及多模態(tài)人工智能研究者學(xué)習(xí),也可用作高等院校相關(guān)專業(yè)的教材及參考書。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容