重慶郵電大學(xué)工業(yè)互聯(lián)網(wǎng)研究院聶文迪獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉重慶郵電大學(xué)工業(yè)互聯(lián)網(wǎng)研究院申請的專利基于深度強化學(xué)習(xí)的無信號燈交叉口控制方法及設(shè)備獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN116564078B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-26發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202310443274.7,技術(shù)領(lǐng)域涉及:G08G1/01;該發(fā)明授權(quán)基于深度強化學(xué)習(xí)的無信號燈交叉口控制方法及設(shè)備是由聶文迪;高德婭;段垚鑫設(shè)計研發(fā)完成,并于2023-04-21向國家知識產(chǎn)權(quán)局提交的專利申請。
本基于深度強化學(xué)習(xí)的無信號燈交叉口控制方法及設(shè)備在說明書摘要公布了:本發(fā)明公開了基于深度強化學(xué)習(xí)的無信號燈交叉口控制方法及設(shè)備,使用了深度強化學(xué)習(xí)算法協(xié)調(diào)控制交叉口無沖突放行,通過沖突點的判斷方式避免了沖突放行,通過獎勵函數(shù)的設(shè)計實現(xiàn)了車輛放行的公平性,以及在此基礎(chǔ)上的最大限度放行,通過交互更新訓(xùn)練后的DQN網(wǎng)絡(luò)計算得到當(dāng)前時刻目標(biāo)無信號燈交叉口的放行動作,減少了車輛的平均等待時間,增加了通行效率,從而解決了無信號燈交叉口車輛擁堵的問題。本發(fā)明相較于現(xiàn)有技術(shù)的深度強化學(xué)習(xí)的無信號燈交叉口放行方法而言,通過使用深度學(xué)習(xí)框架制定交叉口協(xié)調(diào)問題,無需記錄沖突區(qū)域網(wǎng)格的占領(lǐng)情況,降低了計算的復(fù)雜度;同時,將無信號燈交叉口整體進行分析也充分發(fā)揮了交叉口的協(xié)調(diào)潛力。
本發(fā)明授權(quán)基于深度強化學(xué)習(xí)的無信號燈交叉口控制方法及設(shè)備在權(quán)利要求書中公布了:1.基于深度強化學(xué)習(xí)的無信號燈交叉口控制方法,其特征在于,包括: S1、構(gòu)建代理和環(huán)境,其中,所述環(huán)境包括沖突區(qū)和車道區(qū),所述沖突區(qū)中包括沖突點; S2、觀測所述環(huán)境,并獲取t時刻的所述環(huán)境整體的狀態(tài)st,代理通過ε-貪婪策略選取狀態(tài)st下t時刻的放行動作at; S3、代理執(zhí)行所述放行動作at,得到t時刻所述沖突點的沖突情況; S4、根據(jù)所述沖突情況確定t時刻的獎勵rt,并獲取所述環(huán)境整體在t+1時刻的狀態(tài)st+1; S5、將狀態(tài)st、放行動作at、獎勵rt、狀態(tài)st+1整合成經(jīng)驗并存入經(jīng)驗回放池中,使用所述經(jīng)驗回放池中的經(jīng)驗訓(xùn)練代理; S6、通過重復(fù)步驟S2至步驟S5的環(huán)境與代理交互訓(xùn)練,并將訓(xùn)練結(jié)果用于更新DQN網(wǎng)絡(luò); S7、使用更新后的DQN網(wǎng)絡(luò)計算當(dāng)前時刻無信號燈交叉口的放行動作; 觀測所述環(huán)境,并獲取t時刻的所述環(huán)境整體的狀態(tài)st具體包括: 觀測12條道路的道路狀況,并采用12元向量N分別表示12條道路的道路狀況; 其中,若第i條道路的頭車到達所述沖突區(qū),則將第i條道路所對應(yīng)的向量Ni記為第i條道路的車隊長度;否則,將第i條道路所對應(yīng)的向量Ni記為0;其中,0≤i≤11; 此時,將t時刻的所述環(huán)境整體的狀態(tài)st表示為st={N0t,N1t,…,N10t,N11t}; 其中,頭車是指該條道路上向沖突區(qū)方向行駛的車輛中排行第一個的車輛; 交叉口放行能力的獎勵函數(shù)表示如下: rnt=VtVmax 其中,Vt表示t時刻放行的車輛數(shù)量,Vmax表示最大能放行的車輛數(shù)目; 使用排隊長度作為公平性的獎勵函數(shù),公平性的獎勵函數(shù)表示如下: rft=∑NitNmax 其中,Nit表示t時刻被放行車道的車輛數(shù)目,Nmax表示單車道的最大容量; 對每次放行的最大車輛數(shù)目和使用排隊長度作為公平性的獎勵函數(shù)進行歸一化,得到t時刻的獎勵函數(shù),t時刻的獎勵函數(shù)表示如下: 其中,rt為t時刻的獎勵函數(shù),rnt為公平性的獎勵函數(shù),rft為交叉口放行能力的獎勵函數(shù)。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人重慶郵電大學(xué)工業(yè)互聯(lián)網(wǎng)研究院,其通訊地址為:400000 重慶市渝北區(qū)數(shù)據(jù)谷中路28號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 新唐科技日本株式會社中西和幸獲國家專利權(quán)
- 安徽寒武紀信息科技有限公司請求不公布姓名獲國家專利權(quán)
- 華為技術(shù)有限公司朱國峰獲國家專利權(quán)
- 國際商業(yè)機器公司B.赫克馬特肖爾塔巴里獲國家專利權(quán)
- 三星電子株式會社金允貞獲國家專利權(quán)
- 中煤能源研究院有限責(zé)任公司申斌學(xué)獲國家專利權(quán)
- 日月光半導(dǎo)體制造股份有限公司曾吉生獲國家專利權(quán)
- 廣東萬和新電氣股份有限公司盧楚鵬獲國家專利權(quán)
- 塞勒銳科有限公司R·梅爾海姆獲國家專利權(quán)
- 廣東弘景光電科技股份有限公司劉振庭獲國家專利權(quán)


熱門推薦
- 阿里巴巴集團控股有限公司魏振吉獲國家專利權(quán)
- 深圳市歡太科技有限公司郭子亮獲國家專利權(quán)
- 西門子歌美颯可再生能源公司P·B·布洛甘獲國家專利權(quán)
- 桂林創(chuàng)源金剛石有限公司宋京新獲國家專利權(quán)
- 紹興梅奧心磁醫(yī)療科技有限公司盧才義獲國家專利權(quán)
- 格立莫農(nóng)業(yè)技術(shù)(天津)有限公司劉彬獲國家專利權(quán)
- 思科技術(shù)公司凱爾·安德魯·唐納德·梅斯特瑞獲國家專利權(quán)
- 現(xiàn)代自動車株式會社李民在獲國家專利權(quán)
- 阿里巴巴(中國)有限公司穆罕默德·G·薩維爾獲國家專利權(quán)
- 華為技術(shù)有限公司胡丹獲國家專利權(quán)