西安交通大學鄭帥獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉西安交通大學申請的專利一種多智能體協同控制的機械臂自動裝填運動規劃方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115870988B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211717970.4,技術領域涉及:B25J9/16;該發明授權一種多智能體協同控制的機械臂自動裝填運動規劃方法是由鄭帥;楊子桐設計研發完成,并于2022-12-29向國家知識產權局提交的專利申請。
本一種多智能體協同控制的機械臂自動裝填運動規劃方法在說明書摘要公布了:本發明公開了一種多智能體協同控制的機械臂自動裝填運動規劃方法,包括:基于角色分解機械臂裝填任務,劃分多智能體角色;每個智能體獲取觀測信息,獨立做隨機抽樣,控制機械臂執行選中的動作;每個智能體向中央控制器傳輸觀測信息;中央控制器分別讓價值網絡與目標網絡進行預測;中央控制器計算TD目標和TD誤差,并將TD誤差廣播到所有智能體;中央控制器更新價值網絡與目標網絡參數;每個智能體更新策略網絡參數;不斷收集觀測信息與訓練直至迭代次數達到預定值;使用去中心化決策完成機械臂自動裝填運動規劃。本發明具有通用性強、智能體訓練快、自動化程度高的優點,可以滿足智能體聯合狀態動作搜索空間過大條件下的快速訓練需求。
本發明授權一種多智能體協同控制的機械臂自動裝填運動規劃方法在權利要求書中公布了:1.一種多智能體協同控制的機械臂自動裝填運動規劃方法,其特征在于,包括以下步驟: 步驟1基于角色分解機械臂裝填任務,劃分多智能體角色,具體為: 步驟1.1,使用RODE框架學習動作編碼器fe,該編碼器由θe參數化,將one-hot動作映射到d維表示空間; 步驟1.2,使用公式za=fea;θe計算za,其中za表示動作a在d維空間中的表示; 步驟1.3,使用K-means算法根據動作表征對動作進行聚類; 步驟1.4,將每個角色的動作空間設置為包含一個聚類; 步驟1.5,根據聚類結果使用角色分類器為智能體賦予角色; 步驟2每個智能體i與環境交互,獲取觀測信息,獨立做隨機抽樣,控制機械臂執行選中的動作,具體為: 步驟2.1,使用位置傳感器獲取機械臂位姿與機械臂位姿,使用速度傳感器和加速度傳感器獲取機械臂速度與加速度,作為當前觀測信息 步驟2.2,對當前觀測信息進行one-hot編碼; 步驟2.3,將觀測信息輸入到各智能體對應的策略神經網絡中πi中; 步驟2.4,每個智能體i根據以下公式獨立做隨機抽樣,得到各智能體的動作分布: 步驟2.5,控制機械臂執行選中的動作,并再次使用步驟2.1中方法獲取執行動作后的觀測信息 步驟3每個智能體i向中央控制器傳輸觀測信息,具體為: 步驟3.1,每個智能體i對執行動作后觀測信息進行one-hot編碼; 步驟3.2,每個智能體i向中央控制器傳輸觀測信息和 步驟3.3,中央控制器得到狀態和 步驟4中央控制器分別讓價值網絡與目標網絡進行預測; 步驟5中央控制器計算TD目標和TD誤差,并將TD誤差廣播到所有智能體; 步驟6中央控制器更新價值網絡與目標網絡參數; 步驟7每個智能體i更新策略網絡參數; 步驟8重復步驟2至步驟7,當迭代次數達到預定值時,停止收集觀測信息和訓練; 步驟9模型訓練完畢后,使用去中心化決策完成機械臂自動裝填運動規劃。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人西安交通大學,其通訊地址為:710049 陜西省西安市碑林區咸寧西路28號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。