南京郵電大學(xué)霍智勇獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉南京郵電大學(xué)申請的專利一種基于CNN和Transformer特征融合的單目深度估計方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN118052859B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-09發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202410067946.3,技術(shù)領(lǐng)域涉及:G06T7/55;該發(fā)明授權(quán)一種基于CNN和Transformer特征融合的單目深度估計方法是由霍智勇;王振東設(shè)計研發(fā)完成,并于2024-01-17向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種基于CNN和Transformer特征融合的單目深度估計方法在說明書摘要公布了:本發(fā)明屬于計算機(jī)視覺領(lǐng)域,公開了一種基于CNN和Transformer特征融合的單目深度估計方法,包括:首先,構(gòu)建混合深度數(shù)據(jù)集并對其進(jìn)行預(yù)處理,將預(yù)處理后的圖片輸入網(wǎng)絡(luò)提取CNN特征圖,其次,使用特征轉(zhuǎn)換模塊得到類圖像特征圖并調(diào)整類圖像特征圖的尺度,獲得四個Transformer特征圖,而后將兩個特征圖輸入引導(dǎo)融合模塊,獲得四個層級的特征圖并將其輸入解碼融合模塊,獲得解碼后的輸出特征圖;最后將輸出特征圖輸入深度輸出模塊生成深度圖,將深度圖標(biāo)簽和深度圖進(jìn)行損失值計算,得到訓(xùn)練好的模型。本發(fā)明的雙分支結(jié)構(gòu)產(chǎn)生了提升了深度圖的全局準(zhǔn)確性,細(xì)化了局部紋理和邊緣的表現(xiàn),提高了模型的泛化能力。
本發(fā)明授權(quán)一種基于CNN和Transformer特征融合的單目深度估計方法在權(quán)利要求書中公布了:1.一種基于CNN和Transformer特征融合的單目深度估計方法,其特征在于:所述單目深度估計方法具體包括如下步驟: 步驟1、構(gòu)建用于訓(xùn)練的混合深度數(shù)據(jù)集,對混合深度數(shù)據(jù)集中的RGB圖片及其對應(yīng)的深度圖標(biāo)簽進(jìn)行歸一化、數(shù)據(jù)增強(qiáng)的預(yù)處理操作; 步驟2、將步驟1預(yù)處理的RGB圖片輸入到網(wǎng)絡(luò)中,所述網(wǎng)絡(luò)包括編碼部分和解碼部分,所述編碼部分包括Transformer分支、CNN分支和引導(dǎo)融合模塊,所述解碼部分包括解碼融合模塊和深度輸出模塊,所述Transformer分支處理RGB圖片得到一維Transformer特征圖; 步驟3、所述CNN分支處理步驟1預(yù)處理后的RGB圖片并提取四個不同分辨率的CNN特征圖; 步驟4、選取所述Transformer分支中的四層一維Transformer特征圖,并使用所述特征轉(zhuǎn)換模塊將一維Transformer特征圖轉(zhuǎn)換為類圖像特征圖,并用轉(zhuǎn)置卷積調(diào)整類圖像特征圖的尺度,最終獲得與步驟3得到的CNN特征圖相對應(yīng)分辨率的四個Transformer特征圖; 步驟5、步驟3得到的CNN特征圖和步驟4得到的四個Transformer特征圖輸入所述引導(dǎo)融合模塊,獲得四個層級的特征圖,其分辨率為輸入RGB圖片的,其中,將CNN特征圖和四個Transformer特征圖輸入所述引導(dǎo)融合模塊,獲得四個層級的特征圖,具體包括以下步驟: 步驟5.1、對于每個所述引導(dǎo)融合模塊,處理相同尺度的Transformer特征圖和CNN特征圖,先將Transformer特征圖和CNN特征圖沿著通道維度拼接,然后通過3x3卷積,BN和RELU激活函數(shù)降低通道維度; 步驟5.2、使用shuffleattention機(jī)制增強(qiáng)特征表示,使Transformer特征圖和CNN特征圖充分融合; 步驟5.3、通過四個引導(dǎo)融合模塊獲得四個層級的特征圖,其中每個層級的特征圖兼具Transformer的全局信息處理優(yōu)勢和CNN的局部特征提取優(yōu)勢; 步驟6、將步驟5獲得的四個層級的特征圖輸入所述解碼融合模塊,所述解碼融合模塊由殘差卷積單元和上采樣操作組成,通過跳躍連接自下而上的融合四個層級的特征圖,逐步重建圖像細(xì)節(jié),獲得解碼后的輸出特征圖,分辨率為輸入RGB圖片的14; 步驟7、將步驟6得到的解碼后的輸出特征圖輸入所述深度輸出模塊,生成與輸入圖片RGB相同大小、細(xì)節(jié)豐富、準(zhǔn)確性高的深度圖; 步驟8、將輸入RGB圖像的深度圖標(biāo)簽和所述步驟7預(yù)測的深度圖進(jìn)行損失值計算,進(jìn)行網(wǎng)絡(luò)超參數(shù)迭代優(yōu)化,得到訓(xùn)練好的模型。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人南京郵電大學(xué),其通訊地址為:210046 江蘇省南京市棲霞區(qū)文苑路9號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 西門子股份公司J·菲舍爾獲國家專利權(quán)
- 奧動新能源汽車科技有限公司陸文成獲國家專利權(quán)
- 連普樂士株式會社韓勝旭獲國家專利權(quán)
- 特邁馳有限責(zé)任公司丹尼爾·詹姆斯·迪金森獲國家專利權(quán)
- LG電子株式會社張宰赫獲國家專利權(quán)
- 深圳市大疆創(chuàng)新科技有限公司鄭蕭楨獲國家專利權(quán)
- 科迪亞克生物科學(xué)公司努魯?shù)隙鳌·萊維斯獲國家專利權(quán)
- 奧動新能源汽車科技有限公司張建平獲國家專利權(quán)
- 福特全球技術(shù)公司帕特里克·韋伯獲國家專利權(quán)
- 中興通訊股份有限公司呂何平獲國家專利權(quán)