合肥工業(yè)大學(xué)顧東曉獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉合肥工業(yè)大學(xué)申請的專利異構(gòu)多機器智能系統(tǒng)協(xié)同執(zhí)行搜救任務(wù)的優(yōu)化方法及系統(tǒng)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN115879729B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-26發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202211683288.8,技術(shù)領(lǐng)域涉及:G06Q10/0631;該發(fā)明授權(quán)異構(gòu)多機器智能系統(tǒng)協(xié)同執(zhí)行搜救任務(wù)的優(yōu)化方法及系統(tǒng)是由顧東曉;徐正飛;李曉玥;蘇凱翔;楊雪潔;謝懿;王芹;李鵬玉;魏琪設(shè)計研發(fā)完成,并于2022-12-27向國家知識產(chǎn)權(quán)局提交的專利申請。
本異構(gòu)多機器智能系統(tǒng)協(xié)同執(zhí)行搜救任務(wù)的優(yōu)化方法及系統(tǒng)在說明書摘要公布了:本發(fā)明提供一種異構(gòu)多機器智能系統(tǒng)協(xié)同執(zhí)行搜救任務(wù)的優(yōu)化方法及系統(tǒng),涉及人工智能和應(yīng)急搜救技術(shù)領(lǐng)域。本發(fā)明基于多個異構(gòu)機器智能系統(tǒng)的搜救特性對搜救任務(wù)環(huán)境進行建模,并基于建模后的搜救任務(wù)環(huán)境確定每個異構(gòu)機器智能系統(tǒng)的動作空間和狀態(tài)空間;然后基于每個異構(gòu)機器智能系統(tǒng)的動作空間和狀態(tài)空間建立獎勵體系;最后基于上述動作空間、狀態(tài)空間,以及獎勵體系構(gòu)建協(xié)同執(zhí)行搜救任務(wù)模型,并利用深度強化學(xué)習(xí)算法訓(xùn)練和優(yōu)化協(xié)同執(zhí)行搜救任務(wù)模型,利用訓(xùn)練后的模型指導(dǎo)執(zhí)行搜救任務(wù)。本發(fā)明相比于現(xiàn)有技術(shù),多個異構(gòu)智能體在復(fù)雜任務(wù)環(huán)境下執(zhí)行搜救任務(wù)的協(xié)調(diào)性和執(zhí)行效率更高,搜救策略選擇的穩(wěn)定性和準確性更高。
本發(fā)明授權(quán)異構(gòu)多機器智能系統(tǒng)協(xié)同執(zhí)行搜救任務(wù)的優(yōu)化方法及系統(tǒng)在權(quán)利要求書中公布了:1.一種異構(gòu)多機器智能系統(tǒng)協(xié)同執(zhí)行搜救任務(wù)的優(yōu)化方法,其特征在于,所述方法包括: 基于多個異構(gòu)機器智能系統(tǒng)的搜救特性對搜救任務(wù)環(huán)境進行建模,并基于建模后的所述搜救任務(wù)環(huán)境確定每個所述異構(gòu)機器智能系統(tǒng)的動作空間和狀態(tài)空間; 基于每個所述異構(gòu)機器智能系統(tǒng)的動作空間和狀態(tài)空間建立獎勵體系; 基于所述動作空間、狀態(tài)空間,以及獎勵體系構(gòu)建協(xié)同執(zhí)行搜救任務(wù)模型,并利用深度強化學(xué)習(xí)算法訓(xùn)練和優(yōu)化所述協(xié)同執(zhí)行搜救任務(wù)模型; 其中,所述基于所述動作空間、狀態(tài)空間,以及獎勵體系構(gòu)建協(xié)同執(zhí)行搜救任務(wù)模型,并利用深度強化學(xué)習(xí)算法訓(xùn)練和優(yōu)化所述協(xié)同執(zhí)行搜救任務(wù)模型包括: 基于所述動作空間、狀態(tài)空間,以及獎勵體系,結(jié)合多機器智能系統(tǒng)集合、時間,構(gòu)建協(xié)同執(zhí)行搜救任務(wù)模型,所述協(xié)同執(zhí)行搜救任務(wù)模型用描述多機器智能系統(tǒng)的馬爾可夫決策過程六元組I,S,A,T,r,γ表示,其中,I表示多機器智能系統(tǒng)集合;S表示狀態(tài)空間;A表示動作空間;T表示時間;r表示獎勵體系中的獎勵值;γ表示折扣率; 通過深度強化學(xué)習(xí)算法計算復(fù)雜狀態(tài)空間下的動作值函數(shù),逼近最優(yōu)策略,以訓(xùn)練和優(yōu)化所述協(xié)同執(zhí)行搜救任務(wù)模型;所述動作值函數(shù)用公式表示為: Qsi,ai=Qsi,ai+α[ri+γmaxQs′,a′-Qsi,ai] 其中,Qsi,ai為機器智能系統(tǒng)在狀態(tài)si下采取動作ai的Q值;si表示當前狀態(tài);ai表示當前動作;α表示學(xué)習(xí)率;a′表示下一個動作;s′表示下一個時刻的狀態(tài);γ表示折扣率;ri表示獎勵值;i表示機器智能體的序號。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人合肥工業(yè)大學(xué),其通訊地址為:230009 安徽省合肥市包河區(qū)屯溪路193號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。
- 儀坤動力科技(上海)有限公司霍晉陽獲國家專利權(quán)
- 東莞市捷圣智能科技有限公司廖瑞平獲國家專利權(quán)
- 高通股份有限公司M·科什內(nèi)維桑獲國家專利權(quán)
- 富士施樂株式會社半田修獲國家專利權(quán)
- 中國恩菲工程技術(shù)有限公司王彥芳獲國家專利權(quán)
- 華為云計算技術(shù)有限公司辛恩·安東尼·伯格斯瑪獲國家專利權(quán)
- 日本板硝子株式會社千葉和喜獲國家專利權(quán)
- 中國電建集團成都勘測設(shè)計研究院有限公司高紹清獲國家專利權(quán)
- 精拓麗音科技(北京)有限公司周曉孟獲國家專利權(quán)
- 株式會社日立高新技術(shù)古矢美樹獲國家專利權(quán)


熱門推薦
- 新鄉(xiāng)市萬和過濾技術(shù)股份公司牛新伍獲國家專利權(quán)
- 恩布拉科壓縮機工業(yè)和制冷解決方案有限公司F·G·斯坦因獲國家專利權(quán)
- 中興通訊股份有限公司石娜獲國家專利權(quán)
- 深圳市路明交通器材有限公司宋振躍獲國家專利權(quán)
- 富士施樂株式會社菅野誠獲國家專利權(quán)
- 邯鄲市抱發(fā)機械設(shè)備有限公司尹志英獲國家專利權(quán)
- 深圳市繹立銳光科技開發(fā)有限公司陳彬獲國家專利權(quán)
- 三星電子株式會社林鎮(zhèn)佑獲國家專利權(quán)
- 瑞典愛立信有限公司張琦獲國家專利權(quán)
- 東莞市亞登電子有限公司劉述倫獲國家專利權(quán)