中國(guó)科學(xué)技術(shù)大學(xué)秦家虎獲國(guó)家專利權(quán)
買(mǎi)專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉中國(guó)科學(xué)技術(shù)大學(xué)申請(qǐng)的專利基于數(shù)據(jù)降維技術(shù)的機(jī)器人強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)控制方法獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN116834020B 。
龍圖騰網(wǎng)通過(guò)國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-08-26發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202311011642.7,技術(shù)領(lǐng)域涉及:B25J9/16;該發(fā)明授權(quán)基于數(shù)據(jù)降維技術(shù)的機(jī)器人強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)控制方法是由秦家虎;虞健蘭;劉輕塵;韓睿天;李曼設(shè)計(jì)研發(fā)完成,并于2023-08-09向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本基于數(shù)據(jù)降維技術(shù)的機(jī)器人強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)控制方法在說(shuō)明書(shū)摘要公布了:本發(fā)明涉及安全強(qiáng)化技術(shù)領(lǐng)域,公開(kāi)了一種基于數(shù)據(jù)降維技術(shù)的機(jī)器人強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)控制方法,包括以下步驟,在非平衡位置采樣具有高維狀態(tài)空間的機(jī)器人運(yùn)動(dòng)控制軌跡樣本,通過(guò)對(duì)狀態(tài)空間樣本數(shù)據(jù)進(jìn)行降維處理;通過(guò)柵格法在低維空間中對(duì)機(jī)器人狀態(tài)進(jìn)行安全概率估計(jì),采用強(qiáng)化學(xué)習(xí)方法對(duì)高維空間機(jī)器人進(jìn)行運(yùn)動(dòng)策略訓(xùn)練;本發(fā)明可以直接應(yīng)用于真實(shí)物理系統(tǒng)中,無(wú)需仿真建模訓(xùn)練,避免了仿真和實(shí)機(jī)之間的固有差距問(wèn)題,減少了建模成本。
本發(fā)明授權(quán)基于數(shù)據(jù)降維技術(shù)的機(jī)器人強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)控制方法在權(quán)利要求書(shū)中公布了:1.一種基于數(shù)據(jù)降維技術(shù)的機(jī)器人強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)控制方法,包括以下步驟: 步驟A:采集機(jī)器人個(gè)非平衡點(diǎn)初始狀態(tài),得到具有高維空間的機(jī)器人初始運(yùn)動(dòng)軌跡樣本集合,其中為第i個(gè)機(jī)器人運(yùn)動(dòng)軌跡樣本,,為的大小,表示采用矯正控制器對(duì)隨機(jī)給定的機(jī)器人初始狀態(tài)進(jìn)行控制后的機(jī)器人運(yùn)動(dòng)軌跡,是安全標(biāo)簽; 步驟B:用動(dòng)態(tài)時(shí)間規(guī)整算法對(duì)合并數(shù)據(jù)集合中的運(yùn)動(dòng)軌跡之間的距離度量進(jìn)行計(jì)算,未得到反饋運(yùn)動(dòng)軌跡樣本集合時(shí),合并數(shù)據(jù)集合中僅存在;距離度量的計(jì)算方式為:,同時(shí)對(duì)距離度量進(jìn)行歸一化得到距離矩陣;、分別表示合并數(shù)據(jù)集合中第i條、第j條軌跡的初始狀態(tài),在中為、,在中為、;表示動(dòng)態(tài)時(shí)間規(guī)整算法; 步驟C:通過(guò)距離矩陣以及度量學(xué)習(xí)方法,在保持高維空間和低維空間之間的距離度量關(guān)系的情況下,將合并數(shù)據(jù)集合中的初始狀態(tài)即原始高維狀態(tài)空間中的狀態(tài)進(jìn)行降維處理,映射到低維狀態(tài),得到與高維狀態(tài)點(diǎn)集一一對(duì)應(yīng)的低維狀態(tài)點(diǎn)集;是高維空間維度,是低維空間維度; 步驟D:采用多項(xiàng)式回歸方法訓(xùn)練回歸學(xué)習(xí)器得到高維空間和低維空間的映射關(guān)系:,,其中上標(biāo)代表構(gòu)建映射的次數(shù);回歸誤差服從經(jīng)驗(yàn)分布,依次求解的置信區(qū)間,得到預(yù)測(cè)的區(qū)間估計(jì),其中表示置信水平;表示回歸得到的點(diǎn)估計(jì),統(tǒng)一記為,統(tǒng)一記為; 步驟E:根據(jù)當(dāng)前狀態(tài)的區(qū)間估計(jì)的安全概率得到安全的置信度,能夠預(yù)測(cè)機(jī)器人當(dāng)前狀態(tài)是否安全,得到估計(jì)的安全區(qū)域D;若判斷當(dāng)前狀態(tài)為安全,對(duì)機(jī)器人的強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)控制策略進(jìn)行訓(xùn)練; 若判斷當(dāng)前狀態(tài)為不安全,啟用矯正控制器,將機(jī)器人狀態(tài)控制回安全區(qū)域內(nèi),并收集軌跡信息,得到反饋運(yùn)動(dòng)軌跡樣本集合,其中,為反饋運(yùn)動(dòng)軌跡樣本集合的大小,,是真實(shí)訓(xùn)練環(huán)境的機(jī)器人當(dāng)前狀態(tài),表示采用矯正控制器對(duì)進(jìn)行控制后的機(jī)器人運(yùn)動(dòng)軌跡,是安全標(biāo)簽;判斷反饋運(yùn)動(dòng)軌跡樣本集合的大小,當(dāng)時(shí),將反饋運(yùn)動(dòng)軌跡樣本集合和初始運(yùn)動(dòng)軌跡樣本集合合并,得到合并數(shù)據(jù)集合,,其中為初始狀態(tài),將合并數(shù)據(jù)集合作為步驟B中計(jì)算距離矩陣的數(shù)據(jù)來(lái)源,其中表示倍數(shù),是一個(gè)指定的集合大小; 循環(huán)進(jìn)行步驟B-步驟E,得到具有安全保障的機(jī)器人強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)控制策略。
如需購(gòu)買(mǎi)、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人中國(guó)科學(xué)技術(shù)大學(xué),其通訊地址為:230026 安徽省合肥市包河區(qū)金寨路96號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開(kāi)、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 第四范式(北京)技術(shù)有限公司姚權(quán)銘獲國(guó)家專利權(quán)
- 北京云舶在線科技有限公司高志獲國(guó)家專利權(quán)
- 泰科電子(上海)有限公司王長(zhǎng)軍獲國(guó)家專利權(quán)
- 北京沃東天駿信息技術(shù)有限公司常昊獲國(guó)家專利權(quán)
- 武漢華星光電技術(shù)有限公司盧延濤獲國(guó)家專利權(quán)
- 上海海和藥物研究開(kāi)發(fā)有限公司李磊獲國(guó)家專利權(quán)
- 北京京東尚科信息技術(shù)有限公司廖耀華獲國(guó)家專利權(quán)
- 通用電氣公司I·馬爾基爾獲國(guó)家專利權(quán)
- SK新能源株式會(huì)社金泰日獲國(guó)家專利權(quán)
- 杭州信多達(dá)電器有限公司高新忠獲國(guó)家專利權(quán)


熱門(mén)推薦
- 廣東威靈電機(jī)制造有限公司李文瑞獲國(guó)家專利權(quán)
- 先進(jìn)掃描儀公司亞倫·伯恩斯坦獲國(guó)家專利權(quán)
- 北京京東尚科信息技術(shù)有限公司楊牡丹獲國(guó)家專利權(quán)
- 華為技術(shù)有限公司沈日勝獲國(guó)家專利權(quán)
- 株式會(huì)社尼康后藤孝夫獲國(guó)家專利權(quán)
- 羅斯蒙特儲(chǔ)罐雷達(dá)股份公司揚(yáng)·韋斯特林獲國(guó)家專利權(quán)
- 東京毅力科創(chuàng)株式會(huì)社橫田聰裕獲國(guó)家專利權(quán)
- 福特全球技術(shù)公司E·M·庫(kù)爾茨獲國(guó)家專利權(quán)
- 福特全球技術(shù)公司威廉·塞繆爾·施瓦茲獲國(guó)家專利權(quán)
- 上海安浦鳴志自動(dòng)化設(shè)備有限公司張圓圓獲國(guó)家專利權(quán)