北京師范大學斯白露獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京師范大學申請的專利一種集群機器人躲避抓捕的強化學習方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115238870B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210932874.5,技術領域涉及:G06N3/092;該發明授權一種集群機器人躲避抓捕的強化學習方法及系統是由斯白露設計研發完成,并于2022-08-04向國家知識產權局提交的專利申請。
本一種集群機器人躲避抓捕的強化學習方法及系統在說明書摘要公布了:本申請公開了一種集群機器人躲避抓捕的強化學習方法及系統。首先對集群中的個體進行初始化;通過貪婪策略確定目標集群中各個個體的當前時刻動作數據;建立動力學模型進行學習;具體通過低維度的輸入學習周圍個體數量的任務,通過擴充觀察的維度,以學會聚集、防碰撞任務,進一步擴充觀察維度,以學會躲避抓捕的任務。不斷獲取環境信息并執行動作,利用獎賞函數來更新策略網絡,最終完成特定任務的學習。本發明借鑒了生物集群的運動模式以及學習方式,具有高度的仿生性。同時,該框架的學習不依賴于任何先驗的行為規則以約束機器人的行為,而是讓所有個體從最初始的隨機狀態開始學習,降低了人工依賴性,具有良好的魯棒性與可擴展性。
本發明授權一種集群機器人躲避抓捕的強化學習方法及系統在權利要求書中公布了:1.一種集群機器人躲避抓捕的強化學習方法,其特征在于,所述方法包括: S1,獲取目標集群,并對目標集群中的各個個體進行初始化;所述目標集群包括多個被捕機器人和一個捕獵機器人; S2,通過貪婪策略確定所述目標集群中各個個體的當前時刻動作數據;其中,所述動作包括個體的線加速度與轉向角度; S3,建立所述被捕機器人與所述捕獵機器人的動力學模型;所述動力學模型包括三個子網絡結構,其中第一子網絡結構用于獲取當前個體周圍個體數量結果,第二子網絡結構用于獲取聚集及防碰撞結構,第三子網絡結構用于獲取躲避抓捕的相對位置結果; S4,遍歷所述目標集群中的所有個體作為當前個體對所述第一子網絡結構進行訓練,具體使用q-learning對每個個體的策略網絡進行更新; S5,確定所述當前個體的周圍個體的網絡數據,并將所述周圍個體的網絡數據與當前個體進行匹配進行合作學習; S6,更新所述貪婪策略中的概率參數,并開始執行進行下一周期的訓練,直至達到預設的訓練周期; S7,當達到預設的訓練周期第一子網絡收斂后,通過步驟S2到S5依次對第二子網絡結構和第三子網絡結構進行訓練得到目標動力學模型,所述目標動力學模型用于得到集群機器人躲避抓捕結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京師范大學,其通訊地址為:100875 北京市海淀區新街口外大街19號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。