廣東工業大學陳靜獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉廣東工業大學申請的專利一種基于三重注意力機制的自動駕駛感知方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119888654B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411855405.3,技術領域涉及:G06V20/56;該發明授權一種基于三重注意力機制的自動駕駛感知方法是由陳靜;施玲玲;王銘鵬;趙韋杭設計研發完成,并于2024-12-17向國家知識產權局提交的專利申請。
本一種基于三重注意力機制的自動駕駛感知方法在說明書摘要公布了:本發明屬于深度學習技術領域,具體公開了一種基于三重注意力機制的自動駕駛感知算法,首先將激光雷達掃描到的場景原始點云數據輸入到特征編碼網絡進行劃分為一個個的pillars,將3維點云數據轉換成2維的偽圖像;然后將轉變為2D的偽圖輸入到2DBackbone中進行特征提取,得到多尺度多維度的特征;最后進行上采樣拼接后再送入到檢測頭進行檢測任務。本發明提出的DSPE模塊通過引入三重注意力機制,顯著增強了對3D小目標檢測中細粒度信息的提取能力。DSPE不僅改善了傳統最大池化操作造成的特征信息丟失問題,還能有效捕捉每個支柱內點之間的空間相關性、通道間的特征交互以及體素間的上下文依賴關系,大幅提升系統的檢測精度和速度。
本發明授權一種基于三重注意力機制的自動駕駛感知方法在權利要求書中公布了:1.一種基于三重注意力機制的自動駕駛感知方法,其特征在于:包括特征編碼網絡、2Dbackbone以及檢測頭三個部分,包括以下步驟: 步驟一:將激光雷達掃描到的場景原始點云數據輸入到特征編碼網絡進行劃分為一個個的pillars,從而將3維點云數據轉換成2維的偽圖像,具體地, (1)將3D點云數據按照xoy平面,均勻地劃分成一個個網格,每個網格所代表的長方體即為一個pillar,pillar的個數設置為M,落在一個網格中的點則視為在一個pillar中;在KITTI數據集中,點的特征由一個四維向量表示,(x,y,z,r)分別對應點的xyz軸上的坐標和反射強度,將每個點用一個C=10維的向量表示特征,分別為(x,y,z,r,xc,yc,zc,xp,yp,zp),其中,x,y,z,r表明的是該點云的真實坐標信息和反射強度,xc,yc,zc表示每個點相對于體素質心的位置偏移,xp,yp,zp表示每個點相對于其所屬體素中心的坐標偏移; (2)設定一個超參數N對每個pillars中的點的數量加以限制,如果一個pillars中點的數量超過N,則隨機采樣N個點,如果少于N,則用0來填充;這樣原來的3D點云數據就構成了一個(P,N,C)的張量,其中C=10,代表每個點的特征通道數,P代表pillars的個數,N代表點的數量,到此完成了點云數據的張量化; (3)從步驟(2)完成點云的張量化后得到P1∈P×N×C的數據,接著經過一個簡化版的PointNet,進行升維得到P1∈(P,N,D),其中D=64,目前的點云每個點的特征通道數; (4)進行point之間的注意力機制:首先將P1∈(P,N,D)經過位置轉換變為T2∈(N,P,D),應用多頭注意力機制計算點與點之間的相似度并進行加權處理,生成加權后的特征矩陣O∈N×P×D;接著將維度變換回來變成O∈(P,N,D)并取第一個得到O1∈(P,1,D),將P1∈(P,N,D)經過位置轉換變為H2∈(D,P,N),應用多頭注意力機制計算每個點的通道之間的相似度并進行加權處理,生成加權后的特征矩陣K∈D×P×N;再接著將維度變換回來變成K∈(P,N,D)并取第一個得到K1∈(P,N,1),將O1∈(P,1,D)和K1∈(P,N,1)進行逐元素相乘操作得到融合后的特征矩陣KO1∈(P,N,D),將原始特征矩陣P1與融合后的特征矩陣KO1相乘,得到加權特征矩陣KOP1∈P×N×D;最后,將加權特征矩陣KOP1輸入到SENet模塊中,以進一步優化特征表達; (5)經過步驟(4)后,對加權特征矩陣KOP1實施最大池化操作,以提取最具代表性的特征,并減少特征維度,經過此步驟后,得到降維后的特征矩陣KOP2∈P×D;同時,對原始特征矩陣P1也應用最大池化操作,以提取全局特征G1∈P×D,將全局特征G1和降維后的特征KOP2進行逐點相加,生成綜合特征矩陣F∈P×D;最后將點特征分散回它們的pillars中,得到一個(D,H,W)的張量,即一個偽圖像,H,W分別代表偽圖像的長和寬,生成偽圖像以便送入接下來的2Dbackbone進行特征提??; 步驟二:將轉變后的2D的偽圖輸入到2DBackbone中進行特征提取,主要是通過將輸入進來的特征圖進行下采樣為三個不同大小不同通道的特征圖,從而得到多尺度多維度的特征后,進行上采樣拼接; 步驟三:再送入到檢測頭進行預測任務。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廣東工業大學,其通訊地址為:510006 廣東省廣州市東風東路729號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。