西安交通大學(xué)楊宜康獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉西安交通大學(xué)申請(qǐng)的專利一種規(guī)模無關(guān)的無人集群分布式協(xié)同任務(wù)分配方法及系統(tǒng)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN116382337B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-08-22發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202310335605.5,技術(shù)領(lǐng)域涉及:G05D1/46;該發(fā)明授權(quán)一種規(guī)模無關(guān)的無人集群分布式協(xié)同任務(wù)分配方法及系統(tǒng)是由楊宜康;張瑞鵬;馮彥翔設(shè)計(jì)研發(fā)完成,并于2023-03-30向國家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種規(guī)模無關(guān)的無人集群分布式協(xié)同任務(wù)分配方法及系統(tǒng)在說明書摘要公布了:本發(fā)明屬于多無人機(jī)智能體任務(wù)分配技術(shù)領(lǐng)域,涉及一種規(guī)模無關(guān)的無人集群分布式協(xié)同任務(wù)分配方法,采用集中訓(xùn)練分布部署形式,各智能體依靠自身感知和局部通訊,獲取時(shí)敏新任務(wù)和鄰接智能體的信息,利用MF?MADQN進(jìn)行分布式協(xié)同任務(wù)分配。本發(fā)明在各智能體中定義了任務(wù)候選隊(duì)列和任務(wù)執(zhí)行隊(duì)列,可將時(shí)敏新目標(biāo)隨時(shí)納入任務(wù)候選隊(duì)列參與分配,確需執(zhí)行任務(wù)移入任務(wù)執(zhí)行隊(duì)列。此外本發(fā)明方法嵌入平均場機(jī)制,將每個(gè)智能體與其鄰接智能體的交互等效為與一個(gè)虛擬的智能體交互,故可應(yīng)對(duì)大規(guī)模集群和智能體增減時(shí)神經(jīng)網(wǎng)絡(luò)的“維度陷阱”現(xiàn)象,從而有效解決了未知環(huán)境下,存在時(shí)敏新目標(biāo)和智能體增減場景時(shí),大規(guī)模無人集群協(xié)同任務(wù)分配問題。
本發(fā)明授權(quán)一種規(guī)模無關(guān)的無人集群分布式協(xié)同任務(wù)分配方法及系統(tǒng)在權(quán)利要求書中公布了:1.一種規(guī)模無關(guān)的無人集群分布式協(xié)同任務(wù)分配方法,其特征在于,包括以下步驟: 步驟一、場景信息及各智能體初始化: 各智能體Ai對(duì)應(yīng)設(shè)置有任務(wù)候選隊(duì)列Ci和任務(wù)執(zhí)行隊(duì)列Mi,其中各智能體任務(wù)候選隊(duì)列Ci保存待分配任務(wù),而任務(wù)在任務(wù)執(zhí)行隊(duì)列Mi中的順序?yàn)橹悄荏wAi的任務(wù)執(zhí)行順序; 對(duì)于任意任務(wù)tj,j∈{1,…,Nt},其信息為Pj={xj,yj},表示該任務(wù)tj的位置;若存在時(shí)敏新目標(biāo),時(shí)敏新任務(wù)信息為Pnew={xnew,ynew},并將其納入自身任務(wù)候選隊(duì)列Ci中; 步驟二、建立無人機(jī)通訊拓?fù)渑c局部通訊模型; 步驟三、利用平均場機(jī)制建立任務(wù)分配過程各智能體的狀態(tài)空間、動(dòng)作空間及獎(jiǎng)勵(lì)函數(shù): 步驟四、對(duì)MF-MADQN網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到訓(xùn)練完成的MF-MADQN網(wǎng)絡(luò); 步驟五、使用訓(xùn)練完成的MF-MADQN網(wǎng)絡(luò)進(jìn)行多無人機(jī)智能體協(xié)同任務(wù)分配,對(duì)于給定的多無人機(jī)協(xié)同任務(wù)分配場景,各無人機(jī)智能體Ai需要根據(jù)已分配的任務(wù)執(zhí)行隊(duì)列Mi從出發(fā)點(diǎn)出發(fā),依次執(zhí)行打擊相應(yīng)的目標(biāo); 步驟三中,獎(jiǎng)勵(lì)函數(shù)需計(jì)算自身獎(jiǎng)勵(lì)函數(shù)ri和采用考慮虛擬智能體的聯(lián)合獎(jiǎng)勵(lì)其中,各智能體的自身獎(jiǎng)勵(lì)函數(shù)ri由維持獎(jiǎng)勵(lì)接收獎(jiǎng)勵(lì)轉(zhuǎn)移獎(jiǎng)勵(lì)冗余動(dòng)作懲罰四個(gè)部分組成; 智能體Ai在執(zhí)行動(dòng)作ai后自身獎(jiǎng)勵(lì)函數(shù)ri計(jì)算公式如下: ri=ri 0+ri 1+ri 2+ri 3; 維持獎(jiǎng)勵(lì)ri 0表示對(duì)智能體Ai候選任務(wù)隊(duì)列Ci中的任務(wù)選擇維持決策所獲獎(jiǎng)勵(lì),接收獎(jiǎng)勵(lì)ri 1表示對(duì)智能體Ai候選任務(wù)隊(duì)列Ci中的任務(wù)選擇接收決策所獲獎(jiǎng)勵(lì);轉(zhuǎn)移獎(jiǎng)勵(lì)ri 2表示對(duì)智能體Ai候選任務(wù)隊(duì)列Ci中的任務(wù)選擇轉(zhuǎn)移決策所獲獎(jiǎng)勵(lì),冗余動(dòng)作懲罰ri 3表示對(duì)于智能體Ai候選任務(wù)隊(duì)列Ci中空任務(wù)但動(dòng)作決策為接收和轉(zhuǎn)移的懲罰; 由于多智能體強(qiáng)化學(xué)習(xí)在合作情況下的目標(biāo)是最大化全局收益,如果智能體僅考慮自身回報(bào)會(huì)陷入自利,因此采用如下的形式定義聯(lián)合獎(jiǎng)勵(lì)函數(shù) β∈[0,1]表示全局獎(jiǎng)勵(lì)調(diào)整系數(shù),當(dāng)β趨近于0時(shí),表示各智能體更注重自身收益,更為自利;當(dāng)β趨近于1時(shí),表示各智能體更注重合作提高全局收益;Di為智能體Ai能夠建立通訊的鄰接智能體集合。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人西安交通大學(xué),其通訊地址為:710049 陜西省西安市碑林區(qū)咸寧西路28號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 南昌歐菲精密光學(xué)制品有限公司鄒海榮獲國家專利權(quán)
- 段小嬿獲國家專利權(quán)
- 新鄉(xiāng)艾迪威汽車科技有限公司張金萍獲國家專利權(quán)
- 南昌歐菲精密光學(xué)制品有限公司張文燕獲國家專利權(quán)
- 應(yīng)用材料公司M·嘉德瑞獲國家專利權(quán)
- 華為技術(shù)有限公司曹秋楓獲國家專利權(quán)
- 韋伯斯特生物官能(以色列)有限公司Z.扎旦獲國家專利權(quán)
- 阿里巴巴集團(tuán)控股有限公司溫紹錦獲國家專利權(quán)
- 北京達(dá)佳互聯(lián)信息技術(shù)有限公司魯悅獲國家專利權(quán)
- 華盛頓大學(xué)羅伯特·A·蘭根獲國家專利權(quán)