哈爾濱工業大學張立憲獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉哈爾濱工業大學申請的專利一種基于深度強化學習的多無人機編隊控制方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120491673B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510990909.4,技術領域涉及:G05D1/46;該發明授權一種基于深度強化學習的多無人機編隊控制方法及系統是由張立憲;朱益民;張舜智;杜蔚峰;韋章宇;李博;吳桐;楊嘉楠設計研發完成,并于2025-07-18向國家知識產權局提交的專利申請。
本一種基于深度強化學習的多無人機編隊控制方法及系統在說明書摘要公布了:本發明公開了一種基于深度強化學習的多無人機編隊控制方法及系統,涉及無人機控制領域,為解決現有編隊中的無人機應對模型不確定性和多源干擾時,難以確保高的魯棒性、安全性及可靠性的問題。包括:步驟1:考慮到無人機在穿越狹窄通道飛行時所面臨的外部氣流干擾,構建外部氣流干擾模型;步驟2:構建外部氣流干擾影響的無人機飛行動力學模型;步驟3:以PD控制器為基礎控制器,并采用基于UDE的控制器針對模型不確定性及多源干擾進行估計與補償;步驟4:構建基于深度強化學習的無人機魯棒控制優化的狀態空間以及動作空間,并構建側重位置跟蹤、姿態穩定、控制平滑與安全的分段獎勵函數,提升無人機在復雜干擾下的自適應能力。
本發明授權一種基于深度強化學習的多無人機編隊控制方法及系統在權利要求書中公布了:1.一種基于深度強化學習的多無人機編隊控制方法,其特征在于,包括如下步驟: 步驟1:考慮到無人機在穿越狹窄通道飛行時所面臨的外部氣流干擾,構建外部氣流干擾的數學模型; 步驟2:構建外部氣流干擾影響的無人機飛行動力學模型; 步驟3:以PD控制器為基礎控制器,并采用基于UDE的控制器針對模型不確定性及多源干擾進行估計與補償; 步驟4:構建基于深度強化學習的無人機魯棒控制優化的狀態空間以及動作空間,并構建側重位置跟蹤、姿態穩定、控制平滑與安全的分段獎勵函數; 步驟3包括如下過程: 以PD控制器作為基礎控制器,基于UDE的控制器結構為: 其中u是總體控制輸入,u0是基礎控制器,是UDE提供的干擾補償量; 定義無人機的姿態角誤差eγ為: eγ=Θdes-Θ11 Θdes=[φdes,θdes,ψdes]T=[ux,uy,ψdes]T12 其中ux,uy是無人機的外環控制輸入,ψdes是期望偏航角,Θ=[θ,φ,ψ]T為無人機在機體坐標系下姿態角,上角標des代表期望; 通過PD控制,得到無人機的期望角速度: 其中,kp,γ,kd,γ為角度環比例項、微分項反饋增益; 定義無人機的旋轉角速度誤差eσ為: eσ=ωdes-ω14 其中,ω=[p,q,r]T為無人機在機體坐標系下的旋轉角速度; 通過PD控制,得到無人機內環基礎控制器的控制輸出: 其中,kp,σ,kd,σ為角速度環比例項、微分項反饋增益; 定義無人機的位置誤差eα為: eα=pdes-p16 其中,p=[x,y,z]T代表無人機在慣性坐標系下的位置; 定義無人機的速度誤差eβ為: eβ=vdes-v17其中,代表無人機在慣性坐標系下的速度; 以vdes為速度控制器的輸入,得到外環基礎控制器的控制輸出為: 其中kp,β,kd,β為外環比例項、微分項反饋增益; 采用UDE對無人機的干擾進行估計與補償; 假定干擾估計信號與原干擾信號d存在如下關系: 式中Gs是低通濾波器; 將式10帶入式9,得到如下恒等變換: 其中,η=[x,y,z,θ,φ,ψ],g=[0,0,g,0,0,0]T; 將19代入20得: 其中是拉普拉斯變換算子,E是單位矩陣,整理式19-21得到: 考慮設計濾波器Gs=[Gxs,Gys,Gzs,Gφs,Gθs,Gψs]為: 其中,Tλ是濾波器一階時間常數,s是拉普拉斯變換后的復數自變量; 結合方程22~23得到UDE的頻域表達形式為: 其中,T為UDE積分環節增益系數; 通過拉氏反變換得到UDE的時域表達形式為: 其中,ηt、η0分別為t時刻、初始時刻的位姿狀態。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人哈爾濱工業大學,其通訊地址為:150001 黑龍江省哈爾濱市南崗區西大直街92號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。