南京理工大學郭毓獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南京理工大學申請的專利一種基于強化學習的空間機械臂軸孔裝配變阻抗控制方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115256401B 。
龍圖騰網通過國家知識產權局官網在2025-09-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211038250.5,技術領域涉及:B25J9/16;該發明授權一種基于強化學習的空間機械臂軸孔裝配變阻抗控制方法是由郭毓;余朝寶;詹騰達;高鼎峰;周宇航;許銘軒設計研發完成,并于2022-08-29向國家知識產權局提交的專利申請。
本一種基于強化學習的空間機械臂軸孔裝配變阻抗控制方法在說明書摘要公布了:本發明公開了一種強化學習的空間機械臂軸孔裝配變阻抗控制方法,首先分別構建空間機械臂模型以及機械臂關節角狀態和末端位姿的轉換模型,之后利用雙目相機采集裝配孔的位置信息,構建基于強化學習的阻抗控制器,并利用神經網絡對阻抗控制器進行訓練,之后輸入機械臂末端的實時信息,更新阻抗控制器的阻抗參數,輸出機械臂末端的位置修正量,完成空間機械臂軸孔裝配變阻抗控制。本發明的方案基于強化學習對空間機械臂軸孔裝配進行變阻抗控制,其控制可以對動態力進行跟蹤,動態誤差較傳統的定阻抗控制更小,響應速度也更快,可以有效削弱環境中不定因素的影響,與傳統的定阻抗控制有著更優的跟蹤精度。
本發明授權一種基于強化學習的空間機械臂軸孔裝配變阻抗控制方法在權利要求書中公布了:1.一種基于強化學習的空間機械臂軸孔裝配變阻抗控制方法,其特征在于,包括以下步驟: 步驟1、基于DH參數法構建空間機械臂模型; 步驟2、基于正逆運動學算法構建空間機械臂關節角狀態和末端位姿的轉換模型; 步驟3、初始化雙目相機的內外參數,并利用雙目相機采集圖像,獲取裝配孔的位置信息; 步驟4、構建基于強化學習的阻抗控制器,并根據預期目標設置訓練過程中的阻抗參數動作表、獎勵函數以及中止條件: 步驟4-1、構建阻抗控制器: ; 其中,,分別表示空間機械臂末端的實際運動軌跡和期望運動軌跡,表示機械臂末端與外部環境的作用力,分別對應阻抗控制器的期望慣性矩陣,期望剛度矩陣以及期望阻尼矩陣;、分別表示空間機械臂末端實際加速度、期望加速度、實際速度和期望速度,阻抗控制器中選取作為控制量; 步驟4-2、設置獎勵函數: ; ; 其中,T表示單次訓練時長,為期望力與當前時刻力的誤差值; 步驟4-3、設置強化學習的阻抗參數動作表: ; 為設置的修正量; 步驟5、基于神經網絡訓練阻抗控制器: 首先設置訓練的總次數,在單次訓練中收集空間機械臂的經驗表,并將其放置到經驗池,對策略網絡進行更新,通過策略網絡中的預測值與目標網絡之間的殘差更新策略網絡,設置更新時間,一旦超過該更新時間后,將目標網絡利用策略網絡進行替換,實現目標網絡更新,最后通過目標網絡更新環境中的反饋輸出評分最高的動作,依次循環,直至最終設置的訓練總次數大于設定值,結束訓練; 所述策略網絡對基于強化學習的阻抗控制器中的當前時刻的Q值進行預測,基于目標網絡對基于強化學習的阻抗控制器中的下一時刻的Q值進行預測,并將兩個時刻的差值的均方誤差作為損失函數: ; 其中,表示均方誤差,表示t時刻的Q值,表示學習過程中的衰減率; 所述策略網絡采用全神經網絡結構,將機械臂末端的位置、速度、加速度以及力誤差值作為網絡輸入,隱藏層神經元數量設置為400,激活函數選擇ReLU函數,輸出當前時刻各動作的Q值; 所述目標網絡采用全神經網絡結構,將機械臂末端的位置、速度、加速度以及力誤差信息作為網絡輸入,隱藏層神經元數量設置為400,激活函數選擇ReLU函數,輸出下一時刻各動作的Q值; 步驟6、輸入機械臂末端的實時信息,更新阻抗控制器的阻抗參數,輸出機械臂末端的位置修正量,完成空間機械臂軸孔裝配變阻抗控制。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京理工大學,其通訊地址為:210094 江蘇省南京市玄武區孝陵衛200號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。