a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

當前位置:主頁 > 科技論文 > 航空航天論文 >

基于DDQN的運載火箭姿態(tài)控制器參數(shù)設計

發(fā)布時間:2024-07-02 02:42
  探索了利用深度強化學習算法訓練智能體,以代替人類工程師進行火箭姿態(tài)控制器參數(shù)的離線設計方案。建立了多特征秒的火箭頻域分析模型,選定了設計參數(shù)。選擇深度強化學習算法中的雙深度Q學習(Double Deep Q Network,DDQN)算法,通過記憶回放和時間差分迭代的方式讓智能體在與環(huán)境交互過程中不斷學習。設計了對應的馬爾科夫決策過程模型,進行了智能體的訓練和前向測試。結果說明該方法對于運載火箭姿控設計具有一定參考價值。

【文章頁數(shù)】:6 頁

【部分圖文】:

圖1俯仰通道姿控系統(tǒng)閉環(huán)回路結構圖

圖1俯仰通道姿控系統(tǒng)閉環(huán)回路結構圖

要進行火箭姿態(tài)控制器設計首先要建立姿控系統(tǒng)的頻域分析模型?刂撇呗赃x擇工程上常用的基于“小擾動線性化”的增益預置法。本文僅考慮俯仰通道,整個姿控系統(tǒng)閉環(huán)回路的結構如圖1所示[9]。


圖2智能體訓練算法流程圖

圖2智能體訓練算法流程圖

首先初始化記憶回放單元D和兩個網(wǎng)絡的網(wǎng)絡參數(shù)θ和θ-,開始進行實驗。每次實驗智能體最多可進行1500次調(diào)參。每次調(diào)參后,頻域分析得到的裕度值作為狀態(tài)st經(jīng)過式(16)預處理,得到,將其作為當前值網(wǎng)絡的輸入,輸出各動作的狀態(tài)行為值,使用ε-greedy算法選擇動作at并執(zhí)行,得到下....


圖3累計誤差變化隨訓練次數(shù)變化曲線

圖3累計誤差變化隨訓練次數(shù)變化曲線

當網(wǎng)絡在一定程度上收斂時結束智能體訓練。訓練累計誤差結果如圖3所示。訓練開始時誤差較大,累計變化的斜率很大,隨著訓練次數(shù)的增多,誤差減小,斜率放緩。每次實驗的累計回報隨訓練次數(shù)的變化曲線如圖4所示,經(jīng)過一定量的實驗后單次實驗的累計回報能相對穩(wěn)定在20左右。由于智能體的探索以及其他....


圖4單次實驗累計回報隨實驗次數(shù)變化曲線

圖4單次實驗累計回報隨實驗次數(shù)變化曲線

由于火箭姿態(tài)控制器參數(shù)設計沒有嚴格意義上的最優(yōu)參數(shù)集合,所以理論上控制器的可行參數(shù)集合有無窮個。訓練的目的就是讓智能體模擬人類設計師的設計過程,在不斷調(diào)整參數(shù)分析系統(tǒng)性能的過程中,逐漸變得“老道”,從而成為一位優(yōu)秀的控制器“設計師”。3.2智能體前向測試



本文編號:3999568

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/kejilunwen/hangkongsky/3999568.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶6dcfe***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
亚洲女人初尝黑人巨大| av影音资源| 久久人妻无码中文字幕| 国产精品成人无码久久久| 熟女熟乱熟乱熟妇综合网二区| 91丨九色丨蝌蚪熟女露脸| 日韩人妻一区| 亚洲第一| 中文字幕制服丝袜无码网站| 日本怡春院一区二区三区| 亚洲欧美人高清精品a∨| 西西www4444大胆视频| 亚洲综合激情网| 精品久久久久久18禁免费网站| 国产精品成人观看视频| 亚洲综合激情另类小说区| 亚洲综合色视频在线观看 | 老太性开放bbwbbwbbw| 色天使色偷偷色噜噜| 日韩不卡在线| 免费高清av| 精品人妻少妇嫩草AV无码专区| 国产亚洲精品无码不卡| jαpαnesehd熟女熟妇伦| 欧美不卡视频一区发布| 自拍偷自拍亚洲精品被多人伦好爽 | 精品日韩av| 黄色成人影院| 无码国产偷倩在线播放老年人| 精品久久久久免费视| 大桥未久亚洲一区二区| 处破女轻点疼丨98分钟| 国产二级一片内射视频插放| 亚洲中文字幕AV无码区| 日本道色综合久久影院| 狼人无码精华AV午夜精品| 日韩人妻无码一区二区三区久久99| 国产suv精品一区二区69| 伊人久久一区二区三区无码 | 午夜福利一区二区三区| 毛片毛片毛片毛片毛片|