集美大學吳德烽獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉集美大學申請的專利一種基于記憶機制深度強化學習的無人船避碰方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN120010498B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-26發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510484094.2,技術(shù)領域涉及:G05D1/43;該發(fā)明授權(quán)一種基于記憶機制深度強化學習的無人船避碰方法是由吳德烽;范鎮(zhèn)鴻;黎國強;游政;武東杰;涂婉麗;陳國權(quán);劉啟俊;鐘尚坤設計研發(fā)完成,并于2025-04-17向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種基于記憶機制深度強化學習的無人船避碰方法在說明書摘要公布了:本發(fā)明提供一種基于記憶機制深度強化學習的無人船避碰方法,動態(tài)存儲無人船的歷史航行狀態(tài)序列,構(gòu)建固定長度的記憶空間,所述狀態(tài)序列包括目標點相對位置、障礙物相對位置及歷史動作數(shù)據(jù);將所述記憶空間中的狀態(tài)序列輸入強化學習決策網(wǎng)絡,通過門控循環(huán)單元提取時序特征,并結(jié)合多層感知機生成避碰動作指令;基于所述避碰動作指令控制無人船航行,并根據(jù)復合獎勵函數(shù)計算即時獎勵值優(yōu)化網(wǎng)絡參數(shù),實現(xiàn)感知受限下的自主避碰。
本發(fā)明授權(quán)一種基于記憶機制深度強化學習的無人船避碰方法在權(quán)利要求書中公布了:1.一種基于記憶機制深度強化學習的無人船避碰方法,其特征在于: 動態(tài)存儲無人船的歷史航行狀態(tài)序列,構(gòu)建固定長度的記憶空間,所述狀態(tài)序列包括目標點相對位置、障礙物相對位置及歷史動作數(shù)據(jù); 將所述記憶空間中的狀態(tài)序列輸入強化學習決策網(wǎng)絡,通過門控循環(huán)單元提取時序特征,并結(jié)合多層感知機生成避碰動作指令; 基于所述避碰動作指令控制無人船航行,并根據(jù)復合獎勵函數(shù)計算即時獎勵值優(yōu)化網(wǎng)絡參數(shù),實現(xiàn)感知受限下的自主避碰; 所述記憶空間通過先進先出隊列實現(xiàn),每次更新時移除最舊狀態(tài)數(shù)據(jù)并新增當前狀態(tài)數(shù)據(jù); 所述門控循環(huán)單元的隱藏狀態(tài)維度為128,MLP層維度為256,且決策網(wǎng)絡輸出推進力與轉(zhuǎn)矩的高斯分布參數(shù); 所述網(wǎng)絡參數(shù)更新采用連續(xù)n步歷史數(shù)據(jù)采樣,并通過KL散度約束策略更新以避免記憶空間數(shù)據(jù)分布偏移導致的策略震蕩。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人集美大學,其通訊地址為:361021 福建省廈門市集美區(qū)銀江路185號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。