書單推薦
更多
新書推薦
更多

深度強(qiáng)化學(xué)習(xí)算法原理與實(shí)戰(zhàn):基于MATLAB

深度強(qiáng)化學(xué)習(xí)算法原理與實(shí)戰(zhàn):基于MATLAB

定  價(jià):109 元

        

當(dāng)前圖書已被 1 所學(xué)校薦購(gòu)過(guò)!
查看明細(xì)

  • 作者:鄭一 編著
  • 出版時(shí)間:2025/9/1
  • ISBN:9787122475756
  • 出 版 社:化學(xué)工業(yè)出版社
  • 中圖法分類:TP181 
  • 頁(yè)碼:339
  • 紙張:
  • 版次:01
  • 開本:16開
9
7
4
8
7
7
5
1
7
2
5
2
6

讀者對(duì)象:本書可作為高等院校深度強(qiáng)化學(xué)習(xí)課程的教材,亦可作為本科生畢業(yè)設(shè)計(jì)、研究生項(xiàng)目設(shè)計(jì)和廣大科研人員的技術(shù)參考用書。

本書在詳細(xì)闡述強(qiáng)化學(xué)習(xí)基本概念與基本理論的基礎(chǔ)上,循序漸進(jìn)地介紹了深度強(qiáng)化學(xué)習(xí)各常用算法的基本思想、算法偽代碼、算法實(shí)現(xiàn)、基于實(shí)例的算法演示與程序分析等內(nèi)容。具體介紹了Q-learning算法求解最優(yōu)路徑問(wèn)題,SARSA算法求解最優(yōu)安全路徑問(wèn)題,策略迭代算法求解兩地租車最優(yōu)調(diào)度問(wèn)題,價(jià)值迭代算法求解最優(yōu)路徑問(wèn)題,DQN?算法求解平衡系統(tǒng)的最優(yōu)控制問(wèn)題,PG算法求解雙積分系統(tǒng)的最優(yōu)控制問(wèn)題,AC類算法求解股票交易的最優(yōu)推薦策略,SAC算法求解機(jī)器人手臂控球平衡問(wèn)題,PPO算法求解飛行器平穩(wěn)著陸最優(yōu)控制問(wèn)題,DDPG算法求解四足機(jī)器人行走控制策略問(wèn)題,TD3算法求解PID控制器參數(shù)整定問(wèn)題,多智能體強(qiáng)化學(xué)習(xí)的基本概念與基本方法,MAPPO算法求解多智能體協(xié)作運(yùn)送物體問(wèn)題,IPPO算法與MAPPO算法求解協(xié)作競(jìng)爭(zhēng)探索區(qū)域問(wèn)題,MADDPG與DDPG算法求解車輛路徑跟蹤控制問(wèn)題。
本書可作為高等院校深度強(qiáng)化學(xué)習(xí)課程的教材,亦可作為本科生畢業(yè)設(shè)計(jì)、研究生項(xiàng)目設(shè)計(jì)和廣大科研人員的技術(shù)參考用書。
 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容