重慶大學谷振宇獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉重慶大學申請的專利考慮動作異步性的智能網聯汽車高速公路合流決策方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN118781838B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202410729445.7,技術領域涉及:G06Q10/0637;該發明授權考慮動作異步性的智能網聯汽車高速公路合流決策方法是由谷振宇;沈嘉瑋;李東洋;胥肖沄;劉仁韜;姜為設計研發完成,并于2024-06-06向國家知識產權局提交的專利申請。
本考慮動作異步性的智能網聯汽車高速公路合流決策方法在說明書摘要公布了:本發明屬于智能汽車技術領域,公開了一種考慮動作異步性的智能網聯汽車高速公路合流決策方法,包括:S1.對智能網聯汽車ICV和人類駕駛汽車HDV進行功能定義;S2.把混合交通下智能網聯汽車高速公路合流決策表征為一個基于Stackelberg博弈的多智能體強化學習問題,設計考慮車輛動作異步性的時空序列馬爾可夫決策過程;S3.構建Stackelberg博弈模型;S4.采用Actor?Critic多智能體強化學習框架進行訓練與評估。針對高速公路合流區車輛動作協同的異步性,本發明能有效提升智能網聯汽車在混合交通下高速公路合流區的合流決策能力。
本發明授權考慮動作異步性的智能網聯汽車高速公路合流決策方法在權利要求書中公布了:1.一種考慮動作異步性的智能網聯汽車高速公路合流決策方法,其特征在于,包括以下步驟: S1.選擇混合交通下高速公路合流區,并對智能網聯汽車ICV和人類駕駛汽車HDV進行功能定義; S2.把混合交通下智能網聯汽車高速公路合流決策表征為一個基于Stackelberg博弈的多智能體強化學習問題,設計考慮車輛動作異步性的時空序列馬爾可夫決策過程; 所述步驟S2中,針對高速公路合流區車輛動作協同的異步性,設計時空序列馬爾可夫決策過程,表示為: STMDP={S,A,P,R,γ,O} 式中,S表示狀態空間;A表示動作空間;P表示狀態轉移矩陣,表示整個系統的動力學特性;R表示獎勵函數;γ表示折扣因子;oi表示智能體i的動作順序,O=o1,o2,…,om表示所有智能體的動作順序,m表示場景中ICV的數量,其順序排列依據每個ICV的安全優先級指標pi來決定,表示不同ICV在決策階段的重要性; 其中,多智能體系統整體的狀態空間是所有ICV狀態空間的笛卡爾積,表示為: S=S1×S2×…×Sm 式中,St為t時刻一輛ICV的狀態空間;表示車輛的縱向位置,表示車輛的橫向位置,的具體值是以高速公路合流區主道上車輛相對于行駛方向上最左側邊緣的豎直線與車輛相對于路段入口縱向最上側邊緣的水平線的交點為笛卡爾坐標系原點來計算的;表示車輛的縱向速度;表示車輛的橫向速度;n代表所有ICV和HDV的車輛個數,設環境中包含n-m輛HDV和m輛ICV; 其中,整個系統的動作空間為各個ICV的聯合動作,表示為: A=A1×A2×…Am Ai={aleft,aright,aup,adown,acruising} 式中,aleft,aright,aup,adown,acruising分別為向左變道、向右邊變道、加速、減速和保持現狀;Ai為一組離散的高級控制決策,為第i輛ICV的動作空間;執行一次加速或減速操作,車輛對應的加速度變化為2ms2; S3.構建Stackelberg博弈模型; 所述步驟S3構建Stackelberg博弈模型的過程為: S3.1結合多智能體強化學習對車輛合流博弈場景進行描述,確定高速公路匝道合流過程中的博弈論各要素; 各要素包括:參與者、策略集、收益函數、信息集和均衡; 參與者是進入合流區域的所有ICV;策略集是ICV的動作空間;收益函數是ICV的獎勵函數;信息集是ICV的狀態空間;均衡是多個ICV在互相最佳響應的情況下達到的一種穩定狀態; S3.2通過多智能體強化學習,構建Stackelberg博弈模型,表示為: 式中,表示在領導者做出決策πl和跟隨者做出決策πf時領導者的策略函數;表示在同樣情況下跟隨者的策略函數;BRπl表示跟隨者在觀察到領導者的決策πl后做出的最佳響應策略; S3.3進一步明確Stackelberg博弈均衡目標,表示為: 式中,表示在領導者做出決策πlSE和跟隨者做出決策πfSE時領導者在狀態s下的狀態價值函數;表示在領導者做出決策πl和跟隨者做出決策πf時領導者在狀態s下的狀態價值函數;BRπlSE表示跟隨者在觀察到領導者的決策πlSE后做出的最佳響應策略; S3.4設計ICV安全優先級指標,根據ICV安全優先級指標的大小,確定領導者和跟隨者層級,安全優先級指標的值越大,則ICV在多層領導者—跟隨者結構中的位置越接近頂層; 定義第i輛ICV的安全優先級指標為pi,表示為: pi=λ1pl+λ2pe+λ3ph+ηi 式中,λ1,λ2,λ3分別表示合并優先級度量pl、合并距離優先級度量pe以及車頭時距優先級度量ph的權重系數,ηi是服從ηi~N0,0.001的正態分布的隨機變量,目的是防止出現兩輛ICV的安全優先級指標pi相同的情況;pl,pe,ph分別表示為: 式中,x和L分別為第i輛ICV在合并車道上行駛的距離和合并車道長度;dheadway是車頭間距;th是預定義的車頭時距閾值;vt是車輛速度; S4.采用Actor-Critic多智能體強化學習框架進行訓練與評估。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人重慶大學,其通訊地址為:400000 重慶市沙坪壩區正街174號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。