南京郵電大學(xué)田峰獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉南京郵電大學(xué)申請的專利一種基于深度強(qiáng)化學(xué)習(xí)的多用戶通信抗干擾智能決策方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號為:CN115103446B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-19發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202210579127.8,技術(shù)領(lǐng)域涉及:H04W72/541;該發(fā)明授權(quán)一種基于深度強(qiáng)化學(xué)習(xí)的多用戶通信抗干擾智能決策方法是由田峰;馬亮;張嘉華;吳曉富設(shè)計(jì)研發(fā)完成,并于2022-05-25向國家知識(shí)產(chǎn)權(quán)局提交的專利申請。
本一種基于深度強(qiáng)化學(xué)習(xí)的多用戶通信抗干擾智能決策方法在說明書摘要公布了:本發(fā)明公開了一種基于深度強(qiáng)化學(xué)習(xí)的多用戶通信抗干擾智能決策方法,包括步驟:構(gòu)建一個(gè)多用戶無線通信抗干擾系統(tǒng)模型,首先基站將感知到的多用戶和干擾機(jī)的當(dāng)前頻譜信息作為深度強(qiáng)化學(xué)習(xí)的策略神經(jīng)網(wǎng)絡(luò)的輸入,然后根據(jù)動(dòng)態(tài)貪婪算法選擇聯(lián)合動(dòng)作,通過基站反饋幫助用戶智能選擇通信頻段;同時(shí),計(jì)算當(dāng)前時(shí)隙聯(lián)合動(dòng)作產(chǎn)生的立即獎(jiǎng)勵(lì),并將經(jīng)驗(yàn)存入經(jīng)驗(yàn)回放池中。當(dāng)經(jīng)驗(yàn)回放池中的經(jīng)驗(yàn)數(shù)量達(dá)到給定值時(shí),從經(jīng)驗(yàn)池中隨機(jī)抽取一定數(shù)量的經(jīng)驗(yàn)更新策略神經(jīng)網(wǎng)絡(luò)的參數(shù),并每間隔固定時(shí)隙更新一次目標(biāo)神經(jīng)網(wǎng)絡(luò)的參數(shù);重復(fù)訓(xùn)練過程,完成多用戶通信抗干擾智能決策方法。本發(fā)明能實(shí)現(xiàn)多用戶通信抗干擾,有效避免了外部干擾機(jī)和內(nèi)部用戶造成的通信干擾。
本發(fā)明授權(quán)一種基于深度強(qiáng)化學(xué)習(xí)的多用戶通信抗干擾智能決策方法在權(quán)利要求書中公布了:1.一種基于深度強(qiáng)化學(xué)習(xí)的多用戶通信抗干擾智能決策方法,首先構(gòu)建多個(gè)用戶的無線通信抗干擾系統(tǒng)模型,再通過基站的反饋幫助各個(gè)用戶智能選擇最優(yōu)通信頻段,其特征在于,包括步驟如下: S1,構(gòu)建由多個(gè)用戶、一個(gè)基站和一個(gè)干擾機(jī)組成的多用戶無線通信抗干擾系統(tǒng)模型,用戶、基站和干擾機(jī)隨機(jī)分布在一個(gè)開放區(qū)域內(nèi),共享一個(gè)頻譜空間; S2,基站獲取感知到的多用戶和干擾機(jī)的當(dāng)前頻譜信息; S3,建立兩個(gè)卷積神經(jīng)網(wǎng)絡(luò)模型,將當(dāng)前頻譜信息作為卷積神經(jīng)網(wǎng)絡(luò)模型的輸入,然后根據(jù)動(dòng)態(tài)貪婪算法選擇聯(lián)合動(dòng)作,并通過基站反饋幫助用戶智能選擇通信頻段; S4,計(jì)算當(dāng)前時(shí)隙聯(lián)合動(dòng)作產(chǎn)生的立即獎(jiǎng)勵(lì),并將經(jīng)驗(yàn)存入經(jīng)驗(yàn)回放池中;所述經(jīng)驗(yàn)包括當(dāng)前頻譜選擇狀態(tài)、聯(lián)合動(dòng)作、立即獎(jiǎng)勵(lì)和下一個(gè)頻譜選擇信息; S5,當(dāng)經(jīng)驗(yàn)回放池中的經(jīng)驗(yàn)數(shù)量達(dá)到給定值時(shí),從經(jīng)驗(yàn)池中隨機(jī)抽取一定數(shù)量的經(jīng)驗(yàn),更新策略神經(jīng)網(wǎng)絡(luò)的參數(shù),并每間隔固定時(shí)隙更新一次目標(biāo)神經(jīng)網(wǎng)絡(luò)的參數(shù);直至達(dá)到設(shè)定迭代次數(shù)時(shí)停止迭代; 所述步驟S2中,基站根據(jù)所接收到用戶u的信干噪比SINRu判斷用戶u是否通信成功,若通信成功,歸一化門限r(nóng)uf為1,否則為0; 基站所接收到用戶u的信干噪比SINRu為: 其中,Gu表示用戶u到基站的信道增益,Gj表示干擾機(jī)到基站的信道增益,Ujf表示干擾機(jī)的功率譜密度,f表示信號頻率,fk表示為用戶u選擇信道k的中心頻率,fl表示某一用戶選擇信道l的干擾頻率,nf表示噪聲的功率譜密度,表示用戶u選擇信道k時(shí)來自用戶集中其他用戶的同信道干擾;δ為指示函數(shù),如果·為真則為1,否則為0;表示用戶集; 定義βth為信噪比傳輸?shù)拈撝担?dāng)接收到用戶u的信干噪比SINRu大于βth時(shí),表示傳輸成功;當(dāng)接收到用戶u的信干噪比SINRu小于或等于βth時(shí),傳輸失敗;則歸一化門限guf為: 所述步驟S3中,所述兩個(gè)卷積神經(jīng)網(wǎng)絡(luò),一個(gè)是權(quán)值參數(shù)為θ的策略神經(jīng)網(wǎng)絡(luò),另一個(gè)是權(quán)值參數(shù)為θ-的目標(biāo)神經(jīng)網(wǎng)絡(luò),并隨機(jī)初始化權(quán)值參數(shù);將二維的頻譜瀑布Ot作為神經(jīng)網(wǎng)絡(luò)的輸入,經(jīng)過四個(gè)卷積層,然后通過展開層將卷積后的輸出扁平化處理為一維數(shù)據(jù),再經(jīng)過四個(gè)全連接層得到最終的輸出值; 采用動(dòng)態(tài)ε-greedy算法選擇聯(lián)合動(dòng)作at如下: 在每次迭代隨機(jī)選擇動(dòng)作at的概率為ε,而選擇令策略網(wǎng)絡(luò)Qpolicy最大的動(dòng)作a′=argmaxaQpolicyOt,a;θi的概率為1-ε,其中ε0為初始的貪婪概率,decay為衰退系數(shù),i為迭代次數(shù),ε隨著迭代次數(shù)i的增加以指數(shù)級別降低,e為自然常數(shù)。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人南京郵電大學(xué),其通訊地址為:210003 江蘇省南京市鼓樓區(qū)新模范馬路66號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 德克薩斯儀器股份有限公司G·F·查爾德獲國家專利權(quán)
- 路德維格癌癥研究所有限公司G·里特爾獲國家專利權(quán)
- 瑞典愛立信有限公司L·維爾赫姆森獲國家專利權(quán)
- 廣東多尼斯網(wǎng)絡(luò)科技有限公司陳四龍獲國家專利權(quán)
- 江蘇伊施德創(chuàng)新科技有限公司高敬一獲國家專利權(quán)
- 深圳至峰精密制造有限公司伏冰峰獲國家專利權(quán)
- 索尼公司高橋遼平獲國家專利權(quán)
- 特萊索恩基金會(huì)A.奧里克奇奧獲國家專利權(quán)
- 萬華化學(xué)集團(tuán)股份有限公司張立娟獲國家專利權(quán)
- 日本電信電話株式會(huì)社宮原和大獲國家專利權(quán)


熱門推薦
- 四川宏華電氣有限責(zé)任公司萬林獲國家專利權(quán)
- 施瑞源獲國家專利權(quán)
- 紐約州州立大學(xué)研究基金會(huì)J·菊獲國家專利權(quán)
- 廣東美的制冷設(shè)備有限公司陳志航獲國家專利權(quán)
- 中國人民解放軍總醫(yī)院第四醫(yī)學(xué)中心羅殿中獲國家專利權(quán)
- 深圳市中興微電子技術(shù)有限公司吳毅強(qiáng)獲國家專利權(quán)
- 空中客車運(yùn)作有限責(zé)任公司阿列克謝·維奇尼亞科夫獲國家專利權(quán)
- 寧波日興電子有限公司唐勇獲國家專利權(quán)
- 雅馬哈株式會(huì)社前澤陽獲國家專利權(quán)
- 廣東健博通科技股份有限公司宋茂盛獲國家專利權(quán)