本書共分為四篇,即深度強(qiáng)化學(xué)習(xí)、多智能體深度強(qiáng)化學(xué)習(xí)、多任務(wù)深度強(qiáng)化學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)的應(yīng)用。由淺入深、通俗易懂,涵蓋經(jīng)典算法和近幾年的前沿技術(shù)進(jìn)展。特別是書中詳細(xì)介紹了每一種代表性算法的代碼原型實(shí)現(xiàn),旨在理論與實(shí)踐相結(jié)合,讓讀者學(xué)有所得、學(xué)有所用。篇(包含~3章)主要講解深度強(qiáng)化學(xué)習(xí)基礎(chǔ),側(cè)重于單智能體強(qiáng)化學(xué)習(xí)算法,相對簡單,有助于初級讀者理解,同時(shí)涵蓋了近幾年的經(jīng)典算法和一些前沿的研究成果。第二篇(包含第4~5章)主要側(cè)重于對多智能體深度強(qiáng)化學(xué)習(xí)的講解,從多智能體強(qiáng)化學(xué)習(xí)基本概念到相關(guān)算法的講解和分析,以多個(gè)極具代表性的算法為例帶領(lǐng)讀者逐步學(xué)習(xí)多智能體訓(xùn)練及控制的理論與方法。同時(shí),還介紹了多智能體強(qiáng)化學(xué)習(xí)領(lǐng)域一些前沿學(xué)術(shù)成果。第三篇(包含第6~7章)擴(kuò)展到多任務(wù)場景,稱為多任務(wù)深度強(qiáng)化學(xué)習(xí)。首先介紹了多任務(wù)強(qiáng)化學(xué)習(xí)的基本概念和相關(guān)基礎(chǔ)知識(shí),隨后講解了部分經(jīng)典的多任務(wù)深度強(qiáng)化學(xué)習(xí)算法。第四篇(包含第8~11章)主要講解深度強(qiáng)化學(xué)習(xí)的實(shí)際應(yīng)用,涉及游戲、機(jī)器人控制、計(jì)算機(jī)視覺和自然語言處理四大領(lǐng)域。通過領(lǐng)域應(yīng)用中思想和方法的講解,培養(yǎng)讀者跨領(lǐng)域解決實(shí)際問題的能力,以幫助讀者熟練掌握和使用深度強(qiáng)化學(xué)習(xí)這一強(qiáng)大的方法來解決和優(yōu)化實(shí)際工程領(lǐng)域中的問題。
|