![]() ![]() |
基于深度強(qiáng)化學(xué)習(xí)的多智能體協(xié)同算法關(guān)鍵技術(shù)研究
本書主要內(nèi)容包括:1.針對多智能體協(xié)同算法在環(huán)境中信息利用不充分的問題,從圖網(wǎng)絡(luò)角度出發(fā)提出一種新的基于協(xié)同圖信息補(bǔ)全的多智能體協(xié)同算法;2.提出一種新的基于自適應(yīng)正則Anderson加速的多智能體協(xié)同算法;3.提出一種新的面向值函數(shù)分解的多智能體協(xié)同策略融合算法;4.提出一種面向離線多智能體強(qiáng)化學(xué)習(xí)的基于噪聲注入的自監(jiān)督式離線數(shù)據(jù)狀態(tài)表征增強(qiáng)算法。
你還可能感興趣
我要評論
|