南京信息工程大學王翀獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南京信息工程大學申請的專利基于多智能體深度強化學習的城市交通信號協同控制方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114995119B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210151210.5,技術領域涉及:G05B13/04;該發明授權基于多智能體深度強化學習的城市交通信號協同控制方法是由王翀設計研發完成,并于2022-02-16向國家知識產權局提交的專利申請。
本基于多智能體深度強化學習的城市交通信號協同控制方法在說明書摘要公布了:本發明公開了基于多智能體深度強化學習的城市交通信號協同控制方法,包括:采集城市路網的交通狀態信息向量;協調各個子區域交叉口的控制策略,并生成子區域交叉口的控制策略。通過深度強化學習算法優化交通信號燈配時,實時動態地調節交叉口車流,減少擁堵延誤。以降低總旅行時間為目標優化所有交叉口的信號配時,防止單一交叉口優化對路網造成不利影響,并通過強化學習持續更新優化策略。本發明可以滿足城市交通信號控制問題的復雜性、實時性、適應性要求,提升城市路網的整體通行效率,緩解交通擁堵。
本發明授權基于多智能體深度強化學習的城市交通信號協同控制方法在權利要求書中公布了:1.基于多智能體深度強化學習的城市交通信號協同控制方法,其特征在于,包括: 采集城市路網的交通狀態信息向量; 協調各個子區域交叉口的控制策略,并生成子區域交叉口的控制策略,包括: 獲取交通狀態信息向量,動態生成每個子區域交叉口的控制策略,并將每個子區域交叉口的控制策略轉換為對應子區域的交通信號燈的相位配時,具體包括: 將子區域i交通狀態信息,送入訓練獲得的執行網絡; 執行網絡動態生成已知的最優控制策略; 將最優控制策略轉換為對應子區域i交通信號燈的相位配時: 獲取當前交通信號燈的相位配時和相位配時的已執行時長,相位配時的最新執行時長;若,則交通信號燈跳轉執行下一相位配時; 從中提取子區域的擁堵延誤狀態,計算獎勵函數; 獲取下一時刻交通信息狀態和,將存為經驗數據; 基于訓練獲得的本地評價網絡,訓練獲得執行網絡,包括: 訓練獲得本地評價網絡,包括: 采集,獲取歷史經驗數據,為子區域i的歷史時刻的交通狀態信息,為對應的歷史控制策略,為控制策略的獎勵值,為時刻+1子區域的交通狀態信息,為時刻+1全路網交通狀態信息,為歷史經驗數據的容量; 隨機選擇條歷史經驗數據構成訓練數據集; 利用訓練數據集對本地評價網絡進行訓練,包括: 從訓練數據集中提取獎勵向量、交通狀態信息向量和; 訓練獲得的全局執行網絡計算獲得全局優化策略的控制策略分量; 采用軟更新法更新目標評價網絡的權重: , 式中,τ是設定的系數,是更新前的權重,是更新后的目標評價網絡的權重,為的權重; 根據交通狀態信息向量、控制策略分量、獎勵向量以及目標評價網絡的權重,求解使累積獎勵最大的控制目標向量: , 式中,是設定的折扣系數; 計算本地評價網絡的值和控制目標向量之間的loss值: , 式中,是和控制目標向量之間的loss值;是本地評價網絡的權重向量,采用Adam優化器以loss值最小為目標迭代更新;是由該訓練數據集計算得到的loss期望值,,; 判斷是否能收斂到,若收斂到則輸出獲得最終的本地評價網絡。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京信息工程大學,其通訊地址為:224002 江蘇省鹽城市鹽南高新區新河街道文港南路105號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。