西安電子科技大學張向榮獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉西安電子科技大學申請的專利一種基于深度強化學習的波形自適應遴選方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115561723B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211277900.1,技術領域涉及:G01S7/40;該發明授權一種基于深度強化學習的波形自適應遴選方法是由張向榮;阮恒宇;朱進;陶海紅;郭晶晶;張天揚;張超;曹雁軍;韓麗設計研發完成,并于2022-10-19向國家知識產權局提交的專利申請。
本一種基于深度強化學習的波形自適應遴選方法在說明書摘要公布了:本發明公開了一種基于深度強化學習的波形自適應遴選方法,包括:首先通過構建離散系統狀態空間模型,對仿真場景進行建模;再通過最小化目標參數估計的克拉美羅下界構建目標熵狀態,通過前后時刻的真實熵狀態構建波形參數選擇動作的真實熵獎勵;再利用容積卡爾曼濾波器對當前時刻不同波形參數選擇動作的下一時刻目標狀態進行預測;再根據預測的熵狀態構建預測熵獎勵組成前饋循環通路;最后針對多節點場景設計下動作獎勵函數,利用DQN網絡對不同狀態下不同動作的獎勵期望進行價值逼近,得到最終的波形參數選擇動作;本發明能夠在動態環境中快速的適應環境學習動作選擇策略,根據環境的反饋快速自適應的選擇發射波形參數動作,魯棒性強。
本發明授權一種基于深度強化學習的波形自適應遴選方法在權利要求書中公布了:1.一種基于深度強化學習的波形自適應遴選方法,其特征在于,包括: 步驟S1:通過構建離散系統狀態空間模型,對仿真場景進行建模,基于該仿真場景,初始化離散系統狀態空間模型,并對DQN網絡的權重進行隨機初始化; 步驟S2:通過最小化目標參數估計的克拉美羅下界構建目標熵狀態,通過前后時刻的真實熵狀態構建波形參數選擇動作的真實熵獎勵;即構建認知感知器和認知控制器; 步驟S3:利用容積卡爾曼濾波器對當前時刻不同波形參數選擇動作的下一時刻目標狀態進行預測; 步驟S4:根據預測的熵狀態構建預測熵獎勵組成前饋循環通路; 步驟S5:針對多節點場景設計下動作獎勵函數,利用DQN網絡對不同狀態下不同動作的獎勵期望進行價值逼近,得到最終的波形參數選擇動作; 所述步驟S4,包括: 步驟S41:從DQN價值逼近網絡中獲取獎勵期望高的N組波形參數動作選擇; 步驟S42:將N組波形參數動作作為步驟S22中容積卡爾曼濾波器的輸入,得到N組下一時刻目標狀態的估計誤差協方差矩陣預測值; 步驟S43:將N組k+1時刻的估計誤差協方差矩陣預測值傳遞給步驟S2中的認知控制器得到動作選擇的預測熵狀態,得到規劃階段的預測熵獎勵為: 其中: 為k時刻的預測熵狀態; 為k時刻的熵狀態; 步驟S44:將N組預測熵獎勵作為k+1時刻發射波形參數選擇的依據; 步驟S45:存儲N組目標狀態、波形參數選擇動作、獲得的預測熵獎勵。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人西安電子科技大學,其通訊地址為:710071 陜西省西安市雁塔區太白南路2號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。