中山大學楊健敏獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉中山大學申請的專利基于動態圖注意力網絡和深度強化學習的多智能體編隊控制方法、裝置和存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120122722B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510623393.X,技術領域涉及:G05D1/695;該發明授權基于動態圖注意力網絡和深度強化學習的多智能體編隊控制方法、裝置和存儲介質是由楊健敏;龔明;彭志鴻;黃瀅;郭栩;王佳惠;杜龍森;吳卓謙;馬越;湯鈺琳;何浩華;鐘健鋒設計研發完成,并于2025-05-15向國家知識產權局提交的專利申請。
本基于動態圖注意力網絡和深度強化學習的多智能體編隊控制方法、裝置和存儲介質在說明書摘要公布了:本發明公開了一種基于動態圖注意力網絡和深度強化學習的多智能體編隊控制方法、裝置和存儲介質,本發明通過使用圖注意力網絡和獨立近端策略優化模型,能夠將多智能體編隊作為一個多節點網絡進行處理,具體地,對多智能體編隊中的特定智能體通過感知外界所得到的觀測信息進行處理,得到特定智能體的動作概率分布,實現對特定智能體的控制;在對多智能體編隊的控制過程中,聚焦于特定智能體及其鄰居節點,因此可以使用部分智能體感知檢測到的觀測信息來實現對多智能體編隊的控制,可以降低對全局信息的需求,有利于提高控制的實時性,降低因部分智能體故障而導致無法控制的可能性,實現對多智能體編隊的有效控制。本發明廣泛應用于控制技術領域。
本發明授權基于動態圖注意力網絡和深度強化學習的多智能體編隊控制方法、裝置和存儲介質在權利要求書中公布了:1.一種基于動態圖注意力網絡和深度強化學習的多智能體編隊控制方法,其特征在于,所述基于動態圖注意力網絡和深度強化學習的多智能體編隊控制方法包括至少一個處理過程,任一所述處理過程包括以下步驟: 獲取圖注意力網絡;所述圖注意力網絡用于對來自于原始節點的待處理數據與鄰居節點進行特征聚合處理,獲得輸出向量; 獲取獨立近端策略優化模型;所述獨立近端策略優化模型包括第一神經網絡和第二神經網絡,所述第二神經網絡用于對所述輸出向量進行處理,獲得狀態值;所述第一神經網絡用于對所述輸出向量進行處理,獲得動作概率分布; 獲取第一智能體的觀測信息,以所述第一智能體作為所述原始節點,以第二智能體作為所述鄰居節點,以所述第一智能體的觀測信息作為所述待處理數據,輸入到所述圖注意力網絡和所述獨立近端策略優化模型進行處理;所述第一智能體和所述第二智能體為同一多智能體編隊中的不同智能體; 設置所述第一智能體的獎勵函數;所述獎勵函數包括,其中和是調節懲罰強度的系數,表示第一智能體在時刻感知到的全部障礙物的集合,表示第一智能體在時刻與第二智能體的距離,表示第一智能體在時刻與障礙物的距離,表示安全距離;以折扣累積獎勵最大化為目標,確定目標動作,所述折扣累積獎勵根據所述動作概率分布和所述獎勵函數確定;控制所述第一智能體執行所述目標動作。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中山大學,其通訊地址為:510275 廣東省廣州市新港西路135號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。