書單推薦
更多
新書推薦
更多

強(qiáng)化學(xué)習(xí)與隨機(jī)優(yōu)化

強(qiáng)化學(xué)習(xí)與隨機(jī)優(yōu)化

定  價(jià):158 元

叢書名:大數(shù)據(jù)與數(shù)據(jù)科學(xué)專著系列

        

  • 作者:陳志平,劉嘉,徐宗本
  • 出版時(shí)間:2025/10/1
  • ISBN:9787508867519
  • 出 版 社:科學(xué)出版社
  • 中圖法分類:TP181 
  • 頁碼:410
  • 紙張:
  • 版次:1
  • 開本:B5
9
7
8
8
6
7
7
5
5
0
1
8
9

讀者對(duì)象:高等院校數(shù)學(xué)、計(jì)算機(jī)科學(xué)、人工智能、管理科學(xué)等專業(yè)的高年級(jí)本科生、研究生、教師及相關(guān)領(lǐng)域的科技工作者

本書旨在介紹近年來作者在強(qiáng)化學(xué)習(xí)和隨機(jī)優(yōu)化交叉領(lǐng)域的研究成果,主要內(nèi)容包括隨機(jī)優(yōu)化的定量穩(wěn)定性分析,求解多階段隨機(jī)優(yōu)化的新型情景樹生成、約減方法,機(jī)會(huì)約束規(guī)劃問題的模型轉(zhuǎn)換、凸逼近與求解,非平穩(wěn)強(qiáng)化學(xué)習(xí)的樣本復(fù)雜度與泛化能力分析,隨機(jī)優(yōu)化和強(qiáng)化學(xué)習(xí)的統(tǒng)一模型及其基本性質(zhì),風(fēng)險(xiǎn)厭惡馬氏決策過程與強(qiáng)化學(xué)習(xí),分布魯棒機(jī)會(huì)約束馬氏決策過程及其轉(zhuǎn)換與求解算法設(shè)計(jì),連續(xù)狀態(tài)集合、連續(xù)動(dòng)作集合下無限智能體的連續(xù)時(shí)間平均場強(qiáng)化學(xué)習(xí)問題的性質(zhì)與Actor-Critic型求解算法,以及強(qiáng)化學(xué)習(xí)在多期投資組合選擇中的應(yīng)用。本書的目的是幫助讀者掌握如何應(yīng)用強(qiáng)化學(xué)習(xí)或隨機(jī)優(yōu)化來處理不確定環(huán)境下的復(fù)雜動(dòng)態(tài)決策問題、如何開展強(qiáng)化學(xué)習(xí)和隨機(jī)優(yōu)化的交叉研究,以便他們能夠盡快進(jìn)入相應(yīng)研究領(lǐng)域的前沿。

更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容