浙江理工大學(xué)陳剛獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉浙江理工大學(xué)申請(qǐng)的專利一種任務(wù)驅(qū)動(dòng)的通用機(jī)器人智能控制方法及系統(tǒng)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN120395912B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-12發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202510912917.7,技術(shù)領(lǐng)域涉及:B25J9/16;該發(fā)明授權(quán)一種任務(wù)驅(qū)動(dòng)的通用機(jī)器人智能控制方法及系統(tǒng)是由陳剛;李宗函;王天一;魏松海;張祎旸;武傳宇設(shè)計(jì)研發(fā)完成,并于2025-07-03向國家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種任務(wù)驅(qū)動(dòng)的通用機(jī)器人智能控制方法及系統(tǒng)在說明書摘要公布了:本發(fā)明公開了一種任務(wù)驅(qū)動(dòng)的通用機(jī)器人智能控制方法及系統(tǒng)。本發(fā)明通過技能元構(gòu)建技能庫,使得訓(xùn)練機(jī)器人在執(zhí)行任務(wù)時(shí)無需面對(duì)龐大的數(shù)據(jù)集,只需要訓(xùn)練少量數(shù)據(jù)形成技能元,有助于減少數(shù)據(jù)需求,提高任務(wù)成功率,保持高性能的同時(shí)顯著降低了數(shù)據(jù)成本;同時(shí),技能生成器,技能仲裁器的加入使得這些技能元擁有更好的精細(xì)度和通用性,允許跨不同場景和任務(wù)的重用,實(shí)現(xiàn)機(jī)器人的在泛化場景下的復(fù)雜任務(wù)的完成。
本發(fā)明授權(quán)一種任務(wù)驅(qū)動(dòng)的通用機(jī)器人智能控制方法及系統(tǒng)在權(quán)利要求書中公布了:1.一種任務(wù)驅(qū)動(dòng)的通用機(jī)器人智能控制方法,其特征在于,包括以下步驟: 構(gòu)建機(jī)器人初始技能庫; 所述的機(jī)器人初始技能庫中技能元為:根據(jù)所學(xué)習(xí)的技能動(dòng)作,把動(dòng)作切分為能表示完成一件任務(wù)的離散動(dòng)作,然后將相似的離散動(dòng)作分組并定義為技能元; 初始技能庫中技能元的構(gòu)建通過兩種方式: 第一種:在構(gòu)建只涉及單物體交互的技能元時(shí),通過數(shù)據(jù)驅(qū)動(dòng)模擬仿真端到端訓(xùn)練的方式,完成技能元學(xué)習(xí); 第二種:在需要構(gòu)建涉及多物體與多物體交互的技能元時(shí),通過人類先驗(yàn)加自主環(huán)境交互兩個(gè)階段完成學(xué)習(xí)技能元,具體操作如下: 首先進(jìn)行人類先驗(yàn)階段:通過動(dòng)捕遙操作、VR遙操作收集專家示教軌跡數(shù)據(jù)庫,訓(xùn)練初步策略網(wǎng)絡(luò),建立基礎(chǔ)動(dòng)作行為模式; 初步策略網(wǎng)絡(luò)通過以下進(jìn)行定義,其中,是整個(gè)網(wǎng)絡(luò)訓(xùn)練空間,是觀測(cè)狀態(tài),是動(dòng)作,是初始狀態(tài)分布,是依賴于系統(tǒng)動(dòng)態(tài)的未知的轉(zhuǎn)移概率,為獎(jiǎng)勵(lì)函數(shù)同時(shí)編碼任務(wù); 其次進(jìn)入自主環(huán)境交互階段:機(jī)器人在環(huán)境交互中優(yōu)化策略,通過獎(jiǎng)勵(lì)函數(shù)提升性能,不斷地收集在實(shí)際環(huán)境中產(chǎn)生的數(shù)據(jù),并將其加入到訓(xùn)練數(shù)據(jù)中,從而能夠適應(yīng)實(shí)際環(huán)境中的狀態(tài)分布,優(yōu)化基礎(chǔ)動(dòng)作行為模式,最終完成學(xué)習(xí)技能元; 機(jī)器人通過任務(wù)解碼器將復(fù)雜任務(wù)分解為子任務(wù);采用機(jī)器人感知-語言-規(guī)劃模型作為任務(wù)解析器; 在得到子任務(wù)時(shí),機(jī)器人結(jié)合初始技能庫對(duì)子任務(wù)完成執(zhí)行,機(jī)器人通過將預(yù)定義的技能元按任務(wù)需求動(dòng)態(tài)組合與參數(shù)化適配,實(shí)現(xiàn)復(fù)雜任務(wù)的模塊化執(zhí)行; 當(dāng)技能庫中技能元存在缺失,無法完成子任務(wù)時(shí),通過技能生成器生成新技能元; 通過結(jié)合生成的新技能元完成子任務(wù)的執(zhí)行,同時(shí)通過技能仲裁器判斷該技能元是否加入技能庫; 若新生成技能元通過技能仲裁器仲裁,則將其加入技能庫中;若新生成技能元未通過技能仲裁器仲裁,則將其遺忘。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人浙江理工大學(xué),其通訊地址為:310018 浙江省杭州市錢塘區(qū)白楊街道2號(hào)大街928號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。