北京大學王勇濤獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京大學申請的專利基于鳥瞰圖對比學習的自動駕駛多模態自監督預訓練方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115205633B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210889746.7,技術領域涉及:G06V10/774;該發明授權基于鳥瞰圖對比學習的自動駕駛多模態自監督預訓練方法是由王勇濤;林志威;湯幟設計研發完成,并于2022-07-27向國家知識產權局提交的專利申請。
本基于鳥瞰圖對比學習的自動駕駛多模態自監督預訓練方法在說明書摘要公布了:本發明公開了一種基于鳥瞰圖對比學習的自動駕駛多模態自監督預訓練方法,屬于計算機視覺技術領域。該方法利用不同的數據增廣對LiDAR點云數據和圖像數據進行變換,經過網絡分別提取特征后,將兩個模態特征投影到同一個鳥瞰圖BEV空間中,之后利用反變換將兩者的特征對齊,通過細粒度的對比學習來使得網絡能夠學習到通用的LiDAR點云和圖像表征。在實際應用中,訓練得到的具有強表征能力的網絡能夠被應用在多種自動駕駛的下游任務中,包括但不限于3d目標檢測、3d實例分割、語義分割等任務。上述預訓練的網絡能夠被用來初始化檢測器的骨干網絡,加速模型在訓練時的收斂速度,同時提高網絡性能。
本發明授權基于鳥瞰圖對比學習的自動駕駛多模態自監督預訓練方法在權利要求書中公布了:1.一種自動駕駛多模態自監督預訓練方法,其特征在于,包括如下步驟: 1根據所需要的任務,選擇針對LiDAR點云輸入和圖像輸入的兩個骨干網絡,且在圖像骨干網絡額外增加一個深度預測器; 2構建多模態數據增廣策略; 3將自動駕駛數據輸入到步驟2中的多模態數據增廣策略中,得到增廣后的數據,再將該數據輸入到對應模態的骨干網絡中,得到對應模態的特征表示,并將圖像的特征表示輸入到深度預測器中,獲得圖像表征在像素空間上的深度圖; 4構建多模態鳥瞰圖特征,利用步驟3中獲得的深度圖,將2維圖像表征轉換為3維圖像表征,同時利用LiDAR空間和像素空間的轉換矩陣,將3維圖像表征轉換到LiDAR空間,之后壓縮操作,將轉換空間后的3維圖像表征和原本的LiDAR表征轉換為鳥瞰圖表示; 5多模態鳥瞰圖特征對齊,對兩個模態的鳥瞰圖特征用逆數據變換進行變換,得到對齊的鳥瞰圖特征; 6多模態細粒度對比學習,將兩個模態鳥瞰圖特征的余弦相似度與絕對距離作為權重,利用匈牙利算法對兩個模態的鳥瞰圖表征進行匹配,將匹配上的表征作為正樣本,非匹配表征作為負樣本,進行對比學習,實現自動駕駛多模態自監督預訓練。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京大學,其通訊地址為:100871 北京市海淀區頤和園路5號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。