安徽大學高赫佳獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉安徽大學申請的專利輸入飽和的柔性雙連桿機械臂強化學習控制方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119526396B 。
龍圖騰網通過國家知識產權局官網在2025-08-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411695232.3,技術領域涉及:B25J9/16;該發明授權輸入飽和的柔性雙連桿機械臂強化學習控制方法及裝置是由高赫佳;劉江旭;洪濤;孫長銀設計研發完成,并于2024-11-25向國家知識產權局提交的專利申請。
本輸入飽和的柔性雙連桿機械臂強化學習控制方法及裝置在說明書摘要公布了:本發明提供一種輸入飽和的柔性雙連桿機械臂強化學習控制方法及裝置,涉及機器人智能控制技術領域。該方法包括:使用假設模態法,構建柔性雙連桿機械臂系統的動力學模型;設計帶輸入飽和的強化學習自適應振動控制器;根據帶輸入飽和的強化學習自適應振動控制器,對柔性雙連桿機械臂系統進行控制,得到最優控制策略。本發明面向柔性雙連桿機械臂提出了一種帶輔助系統的強化學習算法,利用輔助系統消除飽和非線性函數對機械臂軌跡跟蹤的影響。此外,設計了一種強化學習算法逼近柔性雙連桿機械臂系統的不確定信息,使柔性機械臂在實現軌跡跟蹤的同時抑制彈性振動。
本發明授權輸入飽和的柔性雙連桿機械臂強化學習控制方法及裝置在權利要求書中公布了:1.一種輸入飽和的柔性雙連桿機械臂強化學習控制方法,其特征在于,所述方法包括: S1、使用假設模態法,通過分析柔性雙連桿機械臂的轉動慣量、角速度、線速度、彈性振動構建輸入飽和下柔性雙連桿機械臂系統的動力學模型; S2、設計帶輸入飽和的強化學習自適應振動控制器,包括: S21、根據由預設的參考軌跡與經過柔性雙連桿機械臂系統得到的輸入狀態計算得到的誤差,設計評價神經網絡,用于評估當前輸入飽和下機械臂控制策略的性能; S22、構建用于抵消飽和輸入對振動抑制影響的輔助系統;設計執行神經網絡,用來近似新控制力矩中的未知動力學信息,執行神經網絡根據系統振動誤差、跟蹤誤差、前一刻的控制力矩以及評價網絡的反饋,實時調整控制策略; S23、將系統信息作為輸入數據,送入評價神經網絡進行處理,得到評價神經網絡輸出,將評價神經網絡輸出作為執行神經網絡的輸入,以指導執行神經網絡進行訓練; S24、構建新的李雅普諾夫函數,證實由所述柔性雙連桿機械臂系統的動力學模型以及帶輸入飽和的強化學習自適應振動控制器構成的閉環控制系統具有半全局一致的最終有界性; S3、根據所述帶輸入飽和的強化學習自適應振動控制器,對所述柔性雙連桿機械臂系統進行控制,得到最優控制策略; 所述S1中的輸入飽和下柔性雙連桿機械臂系統的動力學模型,如下式1所示: 式中,JQ表示慣性矩陣,Q=[θ,l]T表示柔性雙連桿機械臂系統的狀態變量,表示隨時間變化的廣義坐標,n1表示第一個連桿的自由度,n2表示第二個連桿的自由度,θ=[θ1,θ2]T表示柔性連桿的旋轉角度,θ1表示第一個連桿轉動的角度,θ2表示第二個連桿轉動的角度,表示狀態變量Q的二階導數,表示科里奧利矩陣和向心效應,表示狀態變量Q的一階導數,表示剛度矩陣, 表示轉矩τ的飽和非線性函數,表示實數集合,N表示系統的總自由度,T表示矩陣轉置,τ表示轉矩; 所述S21中的設計評價神經網絡,包括: S211、設計長期成本函數,用于定量衡量預設時間段內輸入飽和下機械臂的控制策略表現; 其中,長期成本函數,如下式2所示: 式中, 表示評價神經網絡的最優權重,T表示矩陣轉置,Zc表示神經網絡的高斯基函數,Sc=f1=Q1-Qr,f1表示由預設的參考軌跡與經過柔性雙連桿機械臂系統得到的輸入狀態計算得到的誤差,Q1表示當前系統的狀態,Qr表示系統的期望狀態,∈c表示評價神經網絡的逼近誤差,t表示積分的下界,n表示積分變量,ζ表示未來成本的折現系數,Υn表示瞬時成本函數; S212、設計評價神經網絡的權重更新率,如下式3所示: 式中,表示下一時刻評價神經網絡實際的權重值,σc0表示評價神經網絡的學習率,表示當前時刻評價神經網絡實際的權重值, 表示Sc的導數,表示對Sc的梯度,Υt表示瞬時成本函數; 所述S22中的輔助系統,如下式4所示: 式中,表示下一時刻的輔助變量的值,Kξ>0,ξ表示輔助變量,f2表示跟蹤誤差,T表示矩陣轉置,Δτ=Sτ-τ,Sτ表示轉矩τ的飽和非線性函數,
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人安徽大學,其通訊地址為:230000 安徽省合肥市肥西路3號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。