昆明理工大學(xué);昆明云內(nèi)動力股份有限公司沈世全獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉昆明理工大學(xué);昆明云內(nèi)動力股份有限公司申請的專利面向室內(nèi)復(fù)雜環(huán)境的深度強(qiáng)化學(xué)習(xí)型路徑規(guī)劃方法及其裝置獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN120333460B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-29發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510746585.X,技術(shù)領(lǐng)域涉及:G01C21/20;該發(fā)明授權(quán)面向室內(nèi)復(fù)雜環(huán)境的深度強(qiáng)化學(xué)習(xí)型路徑規(guī)劃方法及其裝置是由沈世全;劉佳豪;王艷鋒;張永齊;彭鵠;楊蝶飛設(shè)計研發(fā)完成,并于2025-06-05向國家知識產(chǎn)權(quán)局提交的專利申請。
本面向室內(nèi)復(fù)雜環(huán)境的深度強(qiáng)化學(xué)習(xí)型路徑規(guī)劃方法及其裝置在說明書摘要公布了:本發(fā)明公開了面向室內(nèi)復(fù)雜環(huán)境的深度強(qiáng)化學(xué)習(xí)型路徑規(guī)劃方法及其裝置,屬于人工智能、深度學(xué)習(xí)和路徑規(guī)劃技術(shù)領(lǐng)域,包括:針對機(jī)器人在復(fù)雜動態(tài)環(huán)境中難以充分感知環(huán)境的問題,利用深度卷積神經(jīng)網(wǎng)絡(luò)提取特征信息,增強(qiáng)了對環(huán)境的感知能力;針對傳統(tǒng)路徑規(guī)劃面對動態(tài)障礙物適應(yīng)性差的狀況,設(shè)計了一種基于近端策略優(yōu)化算法的強(qiáng)化學(xué)習(xí)路徑規(guī)劃方法,并設(shè)計了一種基于速度障礙的啟發(fā)式獎勵函數(shù),旨在指導(dǎo)機(jī)器人在保持目標(biāo)方向的同時,找到一個既能動態(tài)避障又能快速向目標(biāo)前進(jìn)的路徑,從而本發(fā)明能夠使機(jī)器人在復(fù)雜場景中擁有高效的規(guī)劃決策能力,以實(shí)現(xiàn)自主、安全、高效地導(dǎo)航至目標(biāo)點(diǎn)。
本發(fā)明授權(quán)面向室內(nèi)復(fù)雜環(huán)境的深度強(qiáng)化學(xué)習(xí)型路徑規(guī)劃方法及其裝置在權(quán)利要求書中公布了:1.一種面向室內(nèi)復(fù)雜環(huán)境的深度強(qiáng)化學(xué)習(xí)型路徑規(guī)劃方法,其特征在于:包括以下步驟: S1、通過雷達(dá)與攝像頭傳感器獲取環(huán)境的感知數(shù)據(jù),估計并識別追蹤出機(jī)器人本體坐標(biāo)系下的位姿狀態(tài)、靜態(tài)障礙物的空間分布以及周圍行人的運(yùn)動學(xué)參數(shù),分模態(tài)處理生成:激光雷達(dá)信息數(shù)據(jù)圖與行人位姿數(shù)據(jù)圖; S2、利用深度卷積神經(jīng)網(wǎng)絡(luò)將激光雷達(dá)信息數(shù)據(jù)圖與行人的位姿數(shù)據(jù)圖進(jìn)行多模態(tài)特征提取,生成包含環(huán)境結(jié)構(gòu)特征、動態(tài)行人運(yùn)動特征及可行區(qū)域約束的特征信息; S3、構(gòu)建深度強(qiáng)化學(xué)習(xí)訓(xùn)練環(huán)境模型,基于近端策略優(yōu)化PPO算法對深度強(qiáng)化學(xué)習(xí)訓(xùn)練環(huán)境模型進(jìn)行網(wǎng)絡(luò)初始化; S4、將提取到的特征信息作為強(qiáng)化學(xué)習(xí)部分觀測狀態(tài)的輸入,采用多目標(biāo)獎勵函數(shù)基于深度強(qiáng)化學(xué)習(xí)近端策略優(yōu)化算法訓(xùn)練最優(yōu)控制策略; 所述步驟S4中近端策略優(yōu)化PPO算法中的多目標(biāo)獎勵函數(shù),是通過以下子步驟實(shí)現(xiàn): S4.1、定義的多目標(biāo)獎勵函數(shù)由四個部分組成,分別是:到達(dá)目標(biāo)獎勵,避免碰撞獎勵,防止機(jī)器人震蕩獎勵和基于速度加轉(zhuǎn)向控制的主動避讓獎勵;即: rt=ra+rc+rx+rv_θ 其中,ra表示到達(dá)目標(biāo)的獎勵,rc表示避免碰撞獎勵,ro表示防止機(jī)器人震蕩獎勵,rθ,v表示基于改進(jìn)的速度障礙理論速度控制與橫向轉(zhuǎn)向控制主動避障獎勵; S4.2、定義到達(dá)目標(biāo)的獎勵ra為: 其中,rarrival表示為到達(dá)目標(biāo)點(diǎn)獎勵系數(shù);表示為在訓(xùn)練步驟t時,當(dāng)前機(jī)器人的位置到目標(biāo)點(diǎn)的距離;rwaypoint表示為路徑點(diǎn)系數(shù);gr表示為到達(dá)目標(biāo)點(diǎn)的范圍寬容;it表示為當(dāng)前的訓(xùn)練步驟數(shù);im表示為一次完整導(dǎo)航的最大步驟數(shù); S4.3、定義避免碰撞獎勵rc為: 其中,rcollision表示為碰撞懲罰系數(shù);dmin是激光雷達(dá)掃描中非零值的最小距離,代表機(jī)器人與最近障礙物的距離,rrobot是機(jī)器人的半徑,rs是掃描距離的懲罰系數(shù); S4.4、定義防止震蕩碰撞獎勵ro為: ro=rsmooth×|θt-1-θt| 其中θt表示為機(jī)器人在步驟t時的方位角,rsmooth表示為震蕩懲罰系數(shù); S4.5、根據(jù)速度障礙理論定義一種基于速度加轉(zhuǎn)向控制的主動避讓獎勵函數(shù)rθ,v; 其中ω1和ω2表示權(quán)重系數(shù),表示為訓(xùn)練步驟t時機(jī)器人期望的最優(yōu)航向角,θm表示為航向方向角的最大允許偏差系數(shù),rθ表示為角度獎勵系數(shù),是機(jī)器人訓(xùn)練步驟t時的最優(yōu)速度,Vm是最大偏差速,rv表示為速度獎勵系數(shù); S5、通過學(xué)習(xí)到的最優(yōu)控制策略,獲得機(jī)器人當(dāng)前觀測狀態(tài)的最優(yōu)動作,在不停車的狀態(tài)下完成動態(tài)避障和導(dǎo)航任務(wù),以實(shí)現(xiàn)在室內(nèi)包含靜態(tài)和多動態(tài)障礙物的復(fù)雜環(huán)境中的路徑規(guī)劃與自主導(dǎo)航。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人昆明理工大學(xué);昆明云內(nèi)動力股份有限公司,其通訊地址為:650093 云南省昆明市一二一大街文昌路68號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 中國科學(xué)院心理研究所黃景新獲國家專利權(quán)
- 康明斯公司J·K·賴特-霍萊茨獲國家專利權(quán)
- 微軟技術(shù)許可有限責(zé)任公司D·戴獲國家專利權(quán)
- 偉創(chuàng)力電子技術(shù)(蘇州)有限公司朱凱獲國家專利權(quán)
- 華為技術(shù)有限公司周天然獲國家專利權(quán)
- 鄭州工程技術(shù)學(xué)院王學(xué)軍獲國家專利權(quán)
- JT國際股份公司T·里維爾獲國家專利權(quán)
- 北京希姆計算科技有限公司羅飛獲國家專利權(quán)
- 艾歐麥克斯治療股份公司彼得·森恩獲國家專利權(quán)
- 洛克菲勒大學(xué)米歇爾·努森茲韋格獲國家專利權(quán)


熱門推薦
- 法雷奧汽車內(nèi)部控制(深圳)有限公司賀川獲國家專利權(quán)
- 天津市金星空氣壓縮機(jī)制造股份有限公司郭瑞彬獲國家專利權(quán)
- 北京三星通信技術(shù)研究有限公司汪巍崴獲國家專利權(quán)
- 揚(yáng)明光學(xué)股份有限公司方韋翔獲國家專利權(quán)
- 黑拉有限責(zé)任兩合公司P·M·約翰遜獲國家專利權(quán)
- 北京地平線機(jī)器人技術(shù)研發(fā)有限公司潘銘星獲國家專利權(quán)
- 炬星科技(深圳)有限公司劉俊斌獲國家專利權(quán)
- 威勝電氣有限公司談賽獲國家專利權(quán)
- 通用電氣健康護(hù)理有限公司J·沃爾伯獲國家專利權(quán)
- 北京比特大陸科技有限公司吳飛獲國家專利權(quán)