北京科技大學;清華大學陳梓睿獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京科技大學;清華大學申請的專利一種依托強化學習的PID軌跡跟蹤控制方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119739151B 。
龍圖騰網通過國家知識產權局官網在2025-09-02發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411674068.8,技術領域涉及:G05D1/43;該發明授權一種依托強化學習的PID軌跡跟蹤控制方法及裝置是由陳梓睿;段京良;李升波;黃晨;劉暢;居易;李軒;朱哿宇;馬飛設計研發完成,并于2024-11-21向國家知識產權局提交的專利申請。
本一種依托強化學習的PID軌跡跟蹤控制方法及裝置在說明書摘要公布了:本發明涉及自動駕駛領域,特別是指一種依托強化學習的PID軌跡跟蹤控制方法及裝置,方法包括:獲取待控制自動駕駛車輛的當前狀態、參考軌跡和實際運行誤差;構建車輛軌跡跟蹤控制的策略模型;將當前狀態和參考軌跡輸入至車輛軌跡跟蹤控制的策略模型,得到PID控制參數;將PID控制參數和實際運行誤差輸入至PID控制器,得到自動駕駛車輛的控制量,根據自動駕駛車輛的控制量,完成自動駕駛車輛軌跡跟蹤控制。本發明利用強化學習強大的學習能力結合PID本身的穩定性以及強魯棒性,實現車輛軌跡跟蹤控制的高實時、高穩定和高精度在線計算。解決當前車輛軌跡跟蹤控制的計算實時性差、應用可靠性弱和依賴復雜動態模型等問題。
本發明授權一種依托強化學習的PID軌跡跟蹤控制方法及裝置在權利要求書中公布了:1.一種依托強化學習的PID軌跡跟蹤控制方法,其特征在于,所述方法包括: S1、獲取待控制自動駕駛車輛的當前狀態、參考軌跡和實際運行誤差; S2、構建車輛軌跡跟蹤控制的策略模型; S3、將所述當前狀態和參考軌跡輸入至車輛軌跡跟蹤控制的策略模型,得到PID控制參數; S4、將所述PID控制參數和實際運行誤差輸入至PID控制器,得到自動駕駛車輛的控制量,根據所述自動駕駛車輛的控制量,完成自動駕駛車輛軌跡跟蹤控制; 所述S2中的車輛軌跡跟蹤控制的策略模型的構建過程,包括: S201、確定初始條件以及參數初始化; 其中,所述確定初始條件包括:確定離散間隔和預測時域,獲取參考軌跡、期望速度信息以及自車狀態; 所述參數初始化包括:初始化PID控制器和強化學習策略; S202、確定初始條件以及參數初始化后,獲取采用數學方程描述的車輛坐標系下的參考軌跡的連續曲線,根據所述參考軌跡的連續曲線,確定當前時刻跟蹤目標點,獲取所述當前時刻跟蹤目標點在大地坐標下的坐標; S203、根據所述當前時刻跟蹤目標點在大地坐標下的坐標、離散間隔、預測時域以及預設的預測橫坐標差,確定預測參考點,獲取預測參考點的參考信息; S204、根據當前時刻的自車狀態以及預測參考點的參考信息,得到下一時刻的跟蹤誤差; S205、根據所述下一時刻的跟蹤誤差,構建目標獎勵函數; S206、根據當前時刻PID控制器的輸出控制量,得到下一時刻跟蹤目標點; S207、根據所述下一時刻跟蹤目標點,獲取車輛的觀測信息; S208、根據所述車輛的觀測信息以及目標獎勵函數,構建車輛軌跡跟蹤控制的策略模型的輸入; S209、設置車輛軌跡跟蹤控制的策略模型的動作約束條件; S210、根據所述車輛軌跡跟蹤控制的策略模型的輸入以及動作約束條件,采用強化學習算法,計算目標獎勵函數,進而得到PID控制參數。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京科技大學;清華大學,其通訊地址為:100083 北京市海淀區學院路30號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。