浙江大學(xué)宋明黎獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉浙江大學(xué)申請的專利基于多智能體對比強化學(xué)習(xí)的電網(wǎng)熱穩(wěn)越限調(diào)控方法和系統(tǒng)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN115603388B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-23發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202211369486.7,技術(shù)領(lǐng)域涉及:H02J3/48;該發(fā)明授權(quán)基于多智能體對比強化學(xué)習(xí)的電網(wǎng)熱穩(wěn)越限調(diào)控方法和系統(tǒng)是由宋明黎;周屹赫;劉順宇設(shè)計研發(fā)完成,并于2022-11-03向國家知識產(chǎn)權(quán)局提交的專利申請。
本基于多智能體對比強化學(xué)習(xí)的電網(wǎng)熱穩(wěn)越限調(diào)控方法和系統(tǒng)在說明書摘要公布了:基于多智能體對比強化學(xué)習(xí)的電網(wǎng)熱穩(wěn)越限調(diào)控方法,首先,根據(jù)典型日電網(wǎng)正常運行數(shù)據(jù)構(gòu)建一系列電網(wǎng)熱穩(wěn)越限數(shù)據(jù)集,并利用圖注意力神經(jīng)網(wǎng)絡(luò)計算電網(wǎng)節(jié)點的嵌入表示向量;然后,在基于協(xié)作架構(gòu)的值分解深度Q網(wǎng)絡(luò)基礎(chǔ)上構(gòu)建發(fā)電機調(diào)控的多智能體強化學(xué)習(xí)框架,該框架根據(jù)電網(wǎng)圖表示特征擬合各發(fā)電機節(jié)點各動作的價值;然后構(gòu)建對比學(xué)習(xí)模型來更好的區(qū)分不同發(fā)電機節(jié)點的特征表示;最后構(gòu)建發(fā)電機動作執(zhí)行模塊,每個發(fā)電機根據(jù)自己節(jié)點的表示向量通過智能體網(wǎng)絡(luò)選取期望價值最大的動作來調(diào)控電網(wǎng),使得電網(wǎng)從熱穩(wěn)越限恢復(fù)到正常狀態(tài)。本發(fā)明還包括基于多智能體對比強化學(xué)習(xí)的電網(wǎng)熱穩(wěn)越限調(diào)控系統(tǒng)。
本發(fā)明授權(quán)基于多智能體對比強化學(xué)習(xí)的電網(wǎng)熱穩(wěn)越限調(diào)控方法和系統(tǒng)在權(quán)利要求書中公布了:1.基于多智能體對比強化學(xué)習(xí)的電網(wǎng)熱穩(wěn)越限調(diào)控方法,包含如下步驟: 步驟1.構(gòu)建電網(wǎng)熱穩(wěn)越限樣本數(shù)據(jù)集; 步驟2.計算電網(wǎng)節(jié)點嵌入矩陣;具體包括:一個電網(wǎng)圖狀態(tài)定義為s=A,H,其中A是包含N個電網(wǎng)節(jié)點的鄰接矩陣,是N個節(jié)點原始特征組成的原始特征矩陣,然后采用圖注意力神經(jīng)網(wǎng)絡(luò)在電網(wǎng)圖網(wǎng)絡(luò)節(jié)點之間進行節(jié)點特征計算: 其中f是計算兩個節(jié)點特征向量相關(guān)度的函數(shù);Wg是可以被訓(xùn)練的線性變換權(quán)重矩陣,Ni是節(jié)點i自己和一階鄰居構(gòu)成的集合,σ·是一個激活函數(shù),用以生成電網(wǎng)圖最后的節(jié)點特征表示 步驟3.構(gòu)建值分解電網(wǎng)多智能體調(diào)控模型;具體包括:采取基于協(xié)作架構(gòu)的值分解深度Q網(wǎng)絡(luò)來構(gòu)建發(fā)電機調(diào)度的多智能體強化學(xué)習(xí)模型,并利用步驟2中生成的電網(wǎng)圖節(jié)點表示特征作為模型輸入,在該架構(gòu)中智能體采用一個具有參數(shù)θ的深度神經(jīng)網(wǎng)絡(luò)來估計電網(wǎng)節(jié)點i特定狀態(tài)下動作a的價值,動作的價值定義為在當(dāng)前電網(wǎng)狀態(tài)下執(zhí)行動作后所得到的期望獎勵值,智能體每次選擇獎勵值最高的動作對電網(wǎng)進行調(diào)控;然后所有節(jié)點計算出的Qi輸入一個信用分配網(wǎng)絡(luò)計算出最終的期望獎勵值Qtot=mixerQ1,Q1,...,Qn;再通過時序差分的方式對神經(jīng)網(wǎng)絡(luò)進行梯度更新; 步驟4.構(gòu)建對比學(xué)習(xí)模型; 步驟5.根據(jù)深度學(xué)習(xí)模型執(zhí)行發(fā)電機動作。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人浙江大學(xué),其通訊地址為:310058 浙江省杭州市西湖區(qū)余杭塘路866號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 昕諾飛控股有限公司A·A·阿博獲國家專利權(quán)
- 上海亞明照明有限公司張紹軍獲國家專利權(quán)
- 中石化石油工程技術(shù)服務(wù)有限公司董懷榮獲國家專利權(quán)
- 聯(lián)想(北京)有限公司張鵬獲國家專利權(quán)
- 余姚市亞東塑業(yè)有限公司胡繼宗獲國家專利權(quán)
- 西門子股份公司R·弗蘭克獲國家專利權(quán)
- 俊富生態(tài)修復(fù)科技有限公司趙民忠獲國家專利權(quán)
- 廣州恒眾車聯(lián)網(wǎng)智能電子技術(shù)有限公司杜志峰獲國家專利權(quán)
- 開迪恩有限公司烏韋·沃爾默獲國家專利權(quán)
- 耐克創(chuàng)新有限合伙公司H.博伊盧獲國家專利權(quán)


熱門推薦
- 施耐德電氣日本控股有限公司慶家蔵獲國家專利權(quán)
- 松下電器(美國)知識產(chǎn)權(quán)公司海上勇二獲國家專利權(quán)
- 博勢股份有限公司S·萊納獲國家專利權(quán)
- BG研究有限公司N·拿撒勒獲國家專利權(quán)
- 高準(zhǔn)有限公司賈斯廷·克雷格·霍林斯沃思獲國家專利權(quán)
- 萊克電氣綠能科技(蘇州)有限公司倪祖根獲國家專利權(quán)
- 法雷奧凱佩科液力變矩器(南京)有限公司王盛璋獲國家專利權(quán)
- 吉成無線(深圳)有限公司謝文卉獲國家專利權(quán)
- LG電子株式會社金范埈獲國家專利權(quán)
- 三星顯示有限公司都永洛獲國家專利權(quán)