a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

當(dāng)前位置:主頁 > 碩博論文 > 信息類博士論文 >

基于值函數(shù)估計偏差修正的強化學(xué)習(xí)方法研究

發(fā)布時間:2024-06-16 08:44
  強化學(xué)習(xí)是求解馬爾科夫決策過程問題的重要方法。強化學(xué)習(xí)的研究已取得了豐富的成果,特別是自深度強化學(xué)習(xí)出現(xiàn)以來,強化學(xué)習(xí)在諸多領(lǐng)域都獲得了相當(dāng)成功的應(yīng)用�;谥岛瘮�(shù)的強化學(xué)習(xí)是其中的一個重要分支,出現(xiàn)了以深度Q網(wǎng)絡(luò)為代表的一大批經(jīng)典算法。在迭代求解動作值函數(shù)的過程中,都會涉及到最大期望動作值函數(shù)的估計問題,與此相伴的是存在其中的估計偏差問題。這個問題同樣也存在于機器學(xué)習(xí)的其它領(lǐng)域中。因此,對最大期望值的準(zhǔn)確估計是個非常重要的問題。本文圍繞值函數(shù)估計偏差修正問題展開研究,主要內(nèi)容如下:(1)針對Q類學(xué)習(xí)算法高估、DQ類學(xué)習(xí)算法低估的問題,研究了最大期望值估計偏差產(chǎn)生的原因,并提出了相應(yīng)的偏差修正思路。首先,提出了次序估計量,并對次序估計量的估計偏差進行了分析,使得現(xiàn)有的最大期望值估計方法均可視為次序估計量的組合形式。其次,分析了現(xiàn)有估計方法存在高估低估的原因,重點對最大估計量和雙估計量的優(yōu)勢與不足進行了分析。最后,得出結(jié)論:單純用某一個次序估計量參與值函數(shù)更新都會帶來不同程度的估計偏差,有控制地隨機組合多個次序估計量能有效修正估計偏差。本部分內(nèi)容為后續(xù)研究工作提供了直接的理論指導(dǎo)。(2)以...

【文章頁數(shù)】:124 頁

【學(xué)位級別】:博士

【部分圖文】:

圖4-4本文用到的Atari2600游戲界面

圖4-4本文用到的Atari2600游戲界面

4基于集成雙估計的偏差修正強化學(xué)習(xí)51Space_invaders是一類競爭性游戲,獎勵稀疏,環(huán)境狀態(tài)部分可觀測,許多算法在該游戲中都不夠穩(wěn)定,用以檢測算法的穩(wěn)定性。Zaxxon游戲中DDQN的執(zhí)行性能明顯的受到低估的影響[52],能測試算法的執(zhí)行效果。AlienAsterixB....


圖6-1DQ中QA與QB在某個狀態(tài)的估計動作值及其置信區(qū)間Figure6-1EstimatedActionValuesandConfidenceIntervalsofQAandQBinDQ

圖6-1DQ中QA與QB在某個狀態(tài)的估計動作值及其置信區(qū)間Figure6-1EstimatedActionValuesandConfidenceIntervalsofQAandQBinDQ

6基于值函數(shù)探索獎勵的貝葉斯深度強化學(xué)習(xí)81函數(shù)探索問題中,值函數(shù)之間還存在組合運算等其它操作的問題。顯然,值函數(shù)探索問題的研究將會復(fù)雜的多,更具挑戰(zhàn)性。(a)QA(b)QB圖6-1DQ中QA與QB在某個狀態(tài)的估計動作值及其置信區(qū)間Figure6-1EstimatedAction....



本文編號:3995169

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/xxkjbs/3995169.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a425a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
国产主播av福利精品一区| 欧美精品v欧洲精品| 国产L精品国产亚洲区在线观看| 亚洲成Aⅴ人片久青草影院按摩| 国产精品久久久久7777按摩| 在线观看免费人成视频播放| 亚洲一区爱区精品无码| 亚洲欧美综合区自拍另类| 亚洲成无码人在线观看| 99热9| 免费无码观看的AV在线播放| 免费久久99精品国产自在现线 | 久久久久久久久| 亚洲国产av一区二区| 狠狠色狠狠色综合网| 一本久久A久久免费精品不卡 | 国产操| 国产欧美日韩综合视频专区| 最新中文字幕aV无码专区| 嘿咻嘿咻免费区在线观看| 玉屏| 国产精品sexvideoshd| 美女张开腿给男人桶爽| 伊人欧美| 亚洲国产精品久久久久婷婷老年| 久久久久久精品无码人妻| 好男人社区www在线观看| 在线精品自偷自拍无码中文| 日韩欧美群交P片內射中文| 国产丶欧美丶日本不卡视频| 欧美俄罗斯乱妇| 免费无码观看的AV在线播放| 亚洲国产精品一区二区久久| 亚洲中文久久精品无码WW16| 凹凸国产熟女精品视频APP| 国产成人无码AⅤ片在线观看| 午夜福利无码免费专区| 成码无人AV片在线电影网站| 国产精品99久久精品爆乳| 超碰aⅴ人人做人人爽欧美| 天堂а在线地址8最新版|