南京輝強新能源科技有限公司熊師洵獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南京輝強新能源科技有限公司申請的專利基于異步多智能體強化學習的雙層非合作需求響應方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120563276B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202511067292.5,技術領域涉及:G06Q50/06;該發明授權基于異步多智能體強化學習的雙層非合作需求響應方法是由熊師洵;張娜;呂沁;陳樹翰設計研發完成,并于2025-07-31向國家知識產權局提交的專利申請。
本基于異步多智能體強化學習的雙層非合作需求響應方法在說明書摘要公布了:本申請公開了一種基于異步多智能體強化學習的雙層非合作需求響應方法,包括:S1、構建雙層非合作博弈框架,包括:構建公用事業公司與消費者之間的雙層動態博弈模型;S2、完成部分可觀測馬爾可夫博弈建模,將雙層非合作博弈轉化為部分可觀測馬爾可夫博弈;S3、設計異步多智能體強化學習算法作為博弈均衡的求解引擎;S4、實施集中訓練與優先級經驗回放實現異步多智能體強化學習算法效率優化。本申請適用于智能電網環境下公用事業公司與消費者群體之間動態博弈場景,能夠實現電網中分布式能源的高效消納與負荷波動抑制。
本發明授權基于異步多智能體強化學習的雙層非合作需求響應方法在權利要求書中公布了:1.一種基于異步多智能體強化學習的雙層非合作需求響應優化方法,其特征在于,包括: S1、構建雙層非合作博弈框架,包括:構建公用事業公司與消費者之間的雙層動態博弈模型;其中,上層公用事業公司策略包括:通過調節儲能系統充放電功率、設定分時電價及DR激勵價格,實現最大化電網收益;下層消費者策略包括:考慮天氣因素外部因素限制和消費者本身消費水平內部因素限制,通過基于內外因素限制適應性調整用電負荷曲線、分布式能源使用比例及DR響應量,在非合作Nash博弈中最小化用電成本;均衡目標包括:雙方策略交互后收斂至Stackelberg-Nash均衡; S2、完成部分可觀測馬爾可夫博弈建模,將雙層非合作博弈轉化為部分可觀測馬爾可夫博弈,定義智能體、狀態空間、觀測空間、動作空間、獎勵函數以及價值函數; S3、設計異步多智能體強化學習算法作為博弈均衡的求解引擎,求解過程包括:采用異步更新的多智能體近端策略優化算法,在Stackelberg階段,上層公用事業公司優先更新策略網絡,消費者基于上層公用事業公司策略更新共享策略編碼器參數;在Nash階段,消費者通過獨立策略解碼器在固定公用事業公司策略下進行Nash博弈優化,策略網絡采用共享編碼器與獨立解碼器結構,確保去中心化執行;并實時監測Stackelberg-Nash均衡的收斂速度與穩定性指標,動態調整公用事業公司與消費者的策略更新頻率和步長; S4、實施集中訓練與優先級經驗回放實現異步多智能體強化學習算法效率優化,包括:采用集中式訓練-分散式執行架構,公用事業公司與消費者共享策略網絡編碼器參數;通過優先級經驗回放機制,根據動作優勢值對歷史軌跡進行加權采樣,優先訓練高回報策略軌跡,加速收斂至均衡策略。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京輝強新能源科技有限公司,其通訊地址為:210018 江蘇省南京市玄武區湖景花園03號201室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。