華南理工大學朱成元獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉華南理工大學申請的專利一種基于交叉注意力的跨視圖融合三維目標檢測方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN118351404B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202410301076.1,技術領域涉及:G06V10/80;該發明授權一種基于交叉注意力的跨視圖融合三維目標檢測方法是由朱成元;胡斌杰設計研發完成,并于2024-03-15向國家知識產權局提交的專利申請。
本一種基于交叉注意力的跨視圖融合三維目標檢測方法在說明書摘要公布了:本發明提出了一種基于交叉注意力的跨視圖融合三維目標檢測方法,屬于三維目標檢測領域,包括對多視圖圖像使用專家感知層改進的圖像骨干網絡進行特征提取,得到多視圖的圖像特征;提取多視圖的激光雷達點云的深度信息獲得密集點云深度圖;將對應視圖的密集點云深度圖與圖像特征進行逐像素拼接,得到帶有深度信息的多視圖圖像特征,根據深度信息生成圖像偽點云,沿z軸展平得到圖像的BEV特征;將激光雷達點云體素化后使用多視圖骨干網絡分別獲取點云的BEV特征和RV特征并拼接;引入交叉注意力機制聚合融合的BEV特征和點云的RV特征,最后得到帶有注意力加權的融合BEV特征,使用回歸檢測頭得到三維目標檢測結果。
本發明授權一種基于交叉注意力的跨視圖融合三維目標檢測方法在權利要求書中公布了:1.一種基于交叉注意力的跨視圖融合三維目標檢測方法,其特征在于,包括以下步驟: S1、獲取不同位置相機采集到的多視圖圖像,使用專家感知模塊優化的圖像骨干網絡進行圖像特征提取獲得圖像的特征信息; 所述專家感知模塊包括門控網絡、專家選擇網絡和基于ALLtoALL算法的集合通信網絡,門控網絡包括全連接層,所述專家網絡是FFN前饋神經網絡;圖像通過圖像骨干網絡進行特征提取和初步處理后輸入到專家感知模塊,首先通過門控網絡對輸入各個特征進行打分,根據輸入的特征的類型和復雜度生成對應的權重值,獲得不同的權重值即分數值,使用softmax函數對權重值進行歸一化處理,然后在第一次ALLtoALL中確定每個輸入的GPU并建立各個GPU之間的通信實現并行處理,并對輸入特征進行分塊,在第一次ALLtoALL之后,專家選擇網絡根據權重值選擇專家網絡對每個特征塊進行特征處理,每一個GPU都擁有自己的專家網絡進行特征處理,特征處理后進行第二次ALLtoALL,將每個專家網絡的輸出進行匯總,根據特征關聯性進行處理后的特征塊拼合得到處理后的圖像特征; S2、獲取激光雷達點云信息,使用密集點云深度信息補全模塊,通過點云生成包含特征深度信息的密集深度圖,將深度圖的特征深度信息與圖像的特征信息逐像素拼接進行深度補全,生成帶有準確深度信息的圖像特征; S3、根據深度信息生成圖像偽點云,并將偽點云進行BEV視圖變換,生成帶有深度信息的圖像BEV特征; S4、使用多視圖點云骨干網絡對激光雷達點云進行提取,分別獲取激光雷達點云的BEV特征和RV特征; S5、將點云的BEV特征同圖像的BEV特征進行拼接; S6、使用跨視圖的交叉注意力網絡將總的BEV特征和點云的RV特征進行融合; S7、使用回歸檢測頭對總的融合特征進行處理和變換,得到最終的檢測結果;最終的三維目標檢測結果包括目標邊界框的類別以及位置參數。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人華南理工大學,其通訊地址為:510640 廣東省廣州市天河區五山路381號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。