北京科技大學陳迪獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京科技大學申請的專利一種具備水空兩用尾鰭的機器人運動模態控制方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119937606B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411988615.X,技術領域涉及:G05D1/49;該發明授權一種具備水空兩用尾鰭的機器人運動模態控制方法及系統是由陳迪;喻俊志;熊嚴;仝茹;王喻;莘展驊設計研發完成,并于2024-12-31向國家知識產權局提交的專利申請。
本一種具備水空兩用尾鰭的機器人運動模態控制方法及系統在說明書摘要公布了:本發明提供了一種具備水空兩用尾鰭的機器人運動模態控制方法及系統,屬于水空兩棲跨介質機器人技術領域,該發明通過傳感器系統和反饋系統收集數據,利用基于強化學習的模態選擇器進行模態選擇和控制,實現了水下模態、水入空模態、空中模態和空入水模態的平穩切換,改善了多模態運動兼容性不足的問題,同時,通過設計水空兩用尾鰭系統,采用尾鰭上舵面的V型調整和尾鰭下舵面的運動,實現了高效、高機動的姿態調節,改善了機器人系統的整體性能不平衡的問題,提高了機器人系統在復雜環境下的作業效率和適應性。
本發明授權一種具備水空兩用尾鰭的機器人運動模態控制方法及系統在權利要求書中公布了:1.一種具備水空兩用尾鰭的機器人運動模態控制方法,其特征在于,所述方法包括: S1、通過傳感器系統,采集數據,得到當前狀態的數據集; S2、根據所述當前狀態的數據集,采用基于強化學習的模態選擇器進行模態的選擇,得到當前環境模態; S3、根據所述當前環境模態,通過控制器系統控制機器人,得到機器人的當前形態; S4、根據所述機器人的當前形態,通過機器人的反饋系統,得到機器人的實際狀態; S5、根據所述機器人的實際狀態,通過控制器系統調節,得到機器人的穩定形態; 所述基于強化學習的模態選擇器的訓練方法,包括: S21、通過設置初始化強化學習環境,得到初始化的Q網絡; S22、將訓練數據集輸入到所述Q網絡中,采用貪婪策略,得到訓練數據集狀態下的機器人模態; S23、根據所述訓練數據集狀態下的機器人模態,通過控制器系統控制機器人,得到機器人的當前訓練形態和機器人的動作; S24、根據所述機器人的當前訓練形態,通過機器人的反饋系統,得到機器人的實際訓練狀態; S25、根據所述機器人的實際訓練狀態與所述機器人的當前訓練形態,通過所述控制器系統調整并進行對比分析,通過公式1,得到模態的正確性獎勵函數和調整后的機器人訓練狀態, rt=Rcorrect-Rincorrect-Rswitch_cost+Refficiency1 式中,rt為模態的正確性獎勵函數,Rcorrect為選擇正確模態的獎勵,Rincorrect為選擇錯誤模態的懲罰,Rswitch_cost為頻繁切換模態的懲罰,Refficiency為能源效率的獎勵; S26、重復步驟S22~S25,將所述機器人的當前訓練形態、所述機器人的動作、所述模態的正確性獎勵函數、所述調整后的機器人訓練狀態存儲到經驗回放池中,得到訓練經驗回放池; S27、將所述訓練經驗回放池輸入到所述Q網絡中,通過公式2,更新Q網絡的參數,得到最終的Q網絡的參數, 式中,Qst,at為當前訓練形態的動作質量函數,st為機器人的當前訓練形態,at為機器人的動作,a′為任意一個機器人的動作,rt為模態的正確性獎勵函數,st+1為調整后的機器人訓練狀態,γ是折扣因子,α是學習率; S28、將所述最終的Q網絡的參數輸入到Q網絡中,得到基于強化學習的模態選擇器; 所述貪婪策略,包括: 策略1:以概率∈選擇一個隨機的機器人的動作指令; 策略2:以概率1-∈選擇一個當前訓練形態的動作質量函數最大值的機器人的動作指令。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京科技大學,其通訊地址為:100083 北京市海淀區學院路30號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。