北京深睿博聯科技有限責任公司;杭州深睿博聯科技有限公司張樹獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京深睿博聯科技有限責任公司;杭州深睿博聯科技有限公司申請的專利一種基于多模態圖像融合的目標檢測方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114694001B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210137919.X,技術領域涉及:G06V10/80;該發明授權一種基于多模態圖像融合的目標檢測方法及裝置是由張樹;馬杰超;俞益洲;李一鳴;喬昕設計研發完成,并于2022-02-15向國家知識產權局提交的專利申請。
本一種基于多模態圖像融合的目標檢測方法及裝置在說明書摘要公布了:本發明提供一種基于多模態圖像融合的目標檢測方法及裝置。所述方法包括:實時獲取視頻圖像和紅外圖像,并分別輸入至由Transformer構成的目標檢測模型;對所述視頻圖像和紅外圖像分別進行全局特征提取;對提取的視頻圖像特征和紅外圖像特征進行融合;將視頻圖像和紅外圖像的融合特征輸入由Transformer全連接層構成的預測模塊,輸出目標類別和目標位置。本發明利用純Transformer構建目標檢測模型,可充分發揮Transformer整體結構帶來的模型優勢;本發明基于視頻圖像和紅外圖像的特征融合進行目標檢測,可以實現任何光照條件下的目標檢測,解決了現有檢測系統在夜晚等黑暗環境下檢測效果差的問題。
本發明授權一種基于多模態圖像融合的目標檢測方法及裝置在權利要求書中公布了:1.一種基于多模態圖像融合的目標檢測方法,其特征在于,包括以下步驟: 實時獲取分別由視頻攝像頭和紅外攝像頭拍攝的視頻圖像和紅外圖像,并分別輸入至由Transformer構成的目標檢測模型; 利用由Transformer編碼器構成的特征編碼模塊對所述視頻圖像和紅外圖像分別進行全局特征提取; 利用由Transformer解碼器構成的特征融合模塊對提取的視頻圖像特征和紅外圖像特征進行融合; 將視頻圖像和紅外圖像的融合特征輸入由Transformer全連接層構成的預測模塊,輸出目標類別和目標位置; 所述特征融合模塊由Transformer解碼器堆疊而成,每個Transformer解碼器包括一個多頭自注意力模塊層、一個多頭互注意力模塊層和一個前饋網絡層以及與每層相連的一個規范化層及殘差單元;為第一層Transformer解碼器單獨初始化定義的查詢向量作為輸入,所述查詢向量為一組可學習的參數,可隱式地學習提取多模態圖像中存在目標的區域的位置編碼,第i個Transformer解碼器的多頭互注意力模塊層的詢問向量Qi來自多頭自注意力模塊層的輸出,鍵向量Ki和值向量Vi分別來自特征編碼模塊輸出的視頻圖像特征A和紅外圖像特征B;第i+1個Transformer解碼器的多頭互注意力模塊層的詢問向量Qi+1來自多頭自注意力模塊層的輸出,鍵向量Ki+1和值向量Vi+1分別來自B和A;鍵向量Ki和值向量Vi均為N×d'矩陣,詢問向量Qi為N'×d'矩陣,N'N;i=1,2,…N'-1。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京深睿博聯科技有限責任公司;杭州深睿博聯科技有限公司,其通訊地址為:100080 北京市海淀區海淀大街8號A座21層A區;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。