中國科學(xué)技術(shù)大學(xué);西安電子科技大學(xué)王毅博獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉中國科學(xué)技術(shù)大學(xué);西安電子科技大學(xué)申請(qǐng)的專利電子對(duì)抗離線決策方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN119830989B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-16發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202411893456.5,技術(shù)領(lǐng)域涉及:G06N3/092;該發(fā)明授權(quán)電子對(duì)抗離線決策方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)是由王毅博;劉洵;胡自然;曾韋智;楊堅(jiān);姜曉楓;楊鋒;何華森;王常龍;周峰設(shè)計(jì)研發(fā)完成,并于2024-12-20向國家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本電子對(duì)抗離線決策方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)在說明書摘要公布了:本發(fā)明公開了一種電子對(duì)抗離線決策方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì),由于復(fù)雜電磁環(huán)境下,干擾方獲取的雷達(dá)狀態(tài)信息部分可觀且?guī)в衅?,一般決策方法求出的干擾策略部署到真實(shí)環(huán)境中時(shí),因其局限性,性能往往難以保證,因此,本發(fā)明提供的方案,通過將電磁環(huán)境建模成對(duì)手智能體,干擾方智能體與對(duì)手智能體進(jìn)行交互訓(xùn)練,得到最終的干擾方智能體,可以更好的進(jìn)行雷達(dá)干擾決策,使干擾方在復(fù)雜電磁環(huán)境下的決策變得高效,安全。
本發(fā)明授權(quán)電子對(duì)抗離線決策方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)在權(quán)利要求書中公布了:1.一種電子對(duì)抗離線決策方法,其特征在于,包括: 將干擾方建模為干擾方智能體; 將給定的歷史博弈序列作為原始數(shù)據(jù)集,并以此構(gòu)建對(duì)手智能體; 交替訓(xùn)練干擾方智能體與對(duì)手智能體,步驟包括:當(dāng)前迭代中,使用對(duì)手智能體進(jìn)行數(shù)據(jù)外推,將生成的數(shù)據(jù)添加至擴(kuò)展數(shù)據(jù)集,使用原始數(shù)據(jù)集與擴(kuò)展數(shù)據(jù)集訓(xùn)練所述干擾方智能體,訓(xùn)練目標(biāo)是最大化干擾方智能體與對(duì)手智能體對(duì)抗時(shí)的干擾值函數(shù);根據(jù)離線對(duì)抗學(xué)習(xí)方法結(jié)合訓(xùn)練當(dāng)前次迭代訓(xùn)練后的干擾方智能體訓(xùn)練所述對(duì)手智能體,訓(xùn)練目標(biāo)是最小化干擾方智能體與對(duì)手智能體對(duì)抗時(shí)的干擾值函數(shù);不斷迭代,獲得最終的干擾方智能體; 將所述最終的干擾方智能體部署于真實(shí)環(huán)境中,用于雷達(dá)干擾決策; 其中,干擾方智能體的雷達(dá)干擾決策問題建模為:在給定歷史博弈序列的情況下,尋找一個(gè)策略π,滿足如下約束: 其中,π為干擾方智能體的策略,Π為干擾方智能體的策略π的集合,為對(duì)手智能體,代表訓(xùn)練過程中的電磁環(huán)境的轉(zhuǎn)移函數(shù);為狀態(tài)轉(zhuǎn)移函數(shù)集合,為表示策略為π的干擾方智能體與對(duì)手智能體對(duì)抗時(shí)的干擾值函數(shù); 所述根據(jù)離線對(duì)抗學(xué)習(xí)方法結(jié)合當(dāng)前次迭代訓(xùn)練后的干擾方智能體訓(xùn)練所述對(duì)手智能體包括: 所述根據(jù)離線對(duì)抗學(xué)習(xí)方法,結(jié)合當(dāng)前次迭代訓(xùn)練后的干擾方智能體的策略,計(jì)算策略梯度,利用策略梯度指導(dǎo)所述對(duì)手智能體的訓(xùn)練; 其中,策略梯度的計(jì)算方式表示為: 其中,為期望,表示狀態(tài)s服從的分布,表示策略π下、狀態(tài)s的訪問分布,a~π表示動(dòng)作選擇策略是π,表示策略為π的干擾方智能體與神經(jīng)網(wǎng)絡(luò)模型對(duì)抗時(shí)的干擾值函數(shù),所述的神經(jīng)網(wǎng)絡(luò)模型表示對(duì)手智能體,φ為神經(jīng)網(wǎng)絡(luò)模型參數(shù),表示下一時(shí)刻的狀態(tài)s′和獎(jiǎng)勵(lì)r來自于對(duì)手智能體的高斯分布 表示在執(zhí)行s,a后,獲得獎(jiǎng)勵(lì)r并轉(zhuǎn)移到狀態(tài)s′的高斯分布,s,a表示狀態(tài)s時(shí)采取動(dòng)作a;γ為設(shè)定系數(shù),表示關(guān)于φ的梯度。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人中國科學(xué)技術(shù)大學(xué);西安電子科技大學(xué),其通訊地址為:230026 安徽省合肥市包河區(qū)金寨路96號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。


熱門推薦
- 太陽誘電株式會(huì)社織茂洋子獲國家專利權(quán)
- 皇家飛利浦有限公司T·G·蒂比獲國家專利權(quán)
- 戴姆勒股份公司M·科勒獲國家專利權(quán)
- 北京京誠科林環(huán)??萍加邢薰緱蠲魅A獲國家專利權(quán)
- 株式會(huì)社迪思科吳斌獲國家專利權(quán)
- 北京字節(jié)跳動(dòng)網(wǎng)絡(luò)技術(shù)有限公司劉鴻彬獲國家專利權(quán)
- 許小寧獲國家專利權(quán)
- 貴州黔森源竹編工藝廠楊杜娟獲國家專利權(quán)
- 北京字節(jié)跳動(dòng)網(wǎng)絡(luò)技術(shù)有限公司劉鴻彬獲國家專利權(quán)
- 北京科吉發(fā)節(jié)能技術(shù)有限公司王保行獲國家專利權(quán)