杭州電子科技大學馬駿獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉杭州電子科技大學申請的專利一種基于深度圖輔助的多視圖語義識別方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119888738B 。
龍圖騰網通過國家知識產權局官網在2025-09-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510077984.1,技術領域涉及:G06V20/70;該發明授權一種基于深度圖輔助的多視圖語義識別方法是由馬駿;顏成鋼;盛熙淳;孫垚棋;高宇涵設計研發完成,并于2025-01-17向國家知識產權局提交的專利申請。
本一種基于深度圖輔助的多視圖語義識別方法在說明書摘要公布了:本發明公開了一種基于深度圖輔助的多視圖語義識別方法。首先獲取多視角深度圖與主視圖RGB圖像;然后進行深度點云的生成與處理;分別進行單視圖RGB圖像的語義識別和深度融合語義識別;最后通過語義融合模塊綜合單視圖語義網絡SVSN和深度融合語義網絡DFSN的輸出結果,生成最終的語義識別結果。本發明利用深度點云捕獲三維幾何結構信息,同時通過RGB圖像提取豐富的紋理和語義特征,并在語義融合階段引入加權平均結合基于規則的動態調整策略,從而有效解決了傳統方法在復雜場景下易受光照變化、遮擋和噪聲干擾的問題。本發明不僅提高了語義識別的全面性和精確性,還增強了模型應對多模態數據不一致和輸入異常情況的能力,具有廣泛的應用前景。
本發明授權一種基于深度圖輔助的多視圖語義識別方法在權利要求書中公布了:1.一種基于深度圖輔助的多視圖語義識別方法,其特征在于,通過以下步驟實現: 步驟1、多視角深度圖與主視圖RGB圖像的獲取; 獲取目標場景的多視角深度圖和主視圖的RGB圖像;將獲取的多視角深度圖數據進行預處理,以確保深度圖數據的質量;選擇一個主視角的RGB圖像即主視圖作為單視圖語義識別的輸入圖像,主視圖應具有最佳的視野、最少的遮擋,并能覆蓋場景中的主要目標物體; 步驟2、深度點云的生成與處理; 將多視角深度圖轉換為多視角的深度點云數據;每個深度圖中的像素點根據其深度值被轉換為三維坐標點,形成點云數據;對生成的多視角深度點云進行處理,包括點云對齊、降噪和稀疏化處理;將處理后的多視角深度點云數據作為深度融合語義網絡DFSN的輸入之一; 步驟3、單視圖RGB圖像的語義識別; 將主視角的RGB圖像輸入單視圖語義網絡SVSN;SVSN采用深度卷積神經網絡架構,首先對RGB圖像進行特征提取;然后SVSN通過多層次語義解碼器對提取到的特征進行逐層解碼,生成初步的語義標簽圖;將SVSN的輸出語義標簽圖存儲,作為最終融合結果的輸入之一; 步驟4、深度融合語義識別; 將預處理后的多視角深度點云與主視角的RGB圖像一起輸入深度融合語義網絡DFSN;DFSN首先分別對深度點云和RGB圖像進行獨立的特征提取;然后對提取的深度點云和RGB圖像特征進行特征對齊,DFSN使用基于注意力機制的特征對齊算法,確保不同模態的特征能夠在同一語義空間內進行對齊; 將對齊后的特征送入特征融合模塊進行融合;該模塊采用自適應特征融合策略,動態調整RGB圖像特征和深度點云特征的權重,以充分發揮各自的優勢;將特征融合模塊輸出的融合特征輸入語義解碼器生成融合后的語義標簽圖; 步驟5、語義識別結果的融合; 通過語義融合模塊綜合單視圖語義網絡SVSN和深度融合語義網絡DFSN的輸出結果;語義融合模塊采用加權平均結合基于規則的融合策略,將兩種網絡的語義識別結果進行組合;具體融合策略為:正常情況下最終預測結果為兩種網絡的語義識別結果的加權平均結果;但在輸入數據缺失,產生遮擋或光線反射的情況下,語義融合模塊將根據不同情況對預測結果進行修正,從而提高最終識別的可靠性;生成最終的語義識別結果; 步驟6、輸出與應用; 將最終生成的語義識別結果以圖像或三維模型的形式輸出,用于后續的分析、處理或決策;該結果能夠用于自動駕駛系統中的實時環境感知、無人機導航系統中的障礙物檢測或智能監控系統中的目標跟蹤。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州電子科技大學,其通訊地址為:310018 浙江省杭州市錢塘區白楊街道2號大街1158號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。