杭州電子科技大學(xué)周曉飛獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉杭州電子科技大學(xué)申請的專利一種基于深度學(xué)習(xí)的輕量級偽裝目標檢測方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN119091117B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-09發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202411098255.6,技術(shù)領(lǐng)域涉及:G06V10/25;該發(fā)明授權(quán)一種基于深度學(xué)習(xí)的輕量級偽裝目標檢測方法是由周曉飛;張峻源;陳張平;章國道;喬通;張繼勇設(shè)計研發(fā)完成,并于2024-08-12向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種基于深度學(xué)習(xí)的輕量級偽裝目標檢測方法在說明書摘要公布了:本發(fā)明公開了一種基于深度學(xué)習(xí)的輕量級偽裝目標檢測方法,該方法首先獲取偽裝物體圖像數(shù)據(jù)集,進行預(yù)處理,并劃分為訓(xùn)練集和測試集。其次將測試集數(shù)據(jù)輸入初級特征提取網(wǎng)絡(luò),進行初級特征提取。然后依次通過頻譜門控單元、混合注意力機制、全局信息模塊、邊緣感知模塊、邊緣引導(dǎo)模塊,對初級特征進行強化處理。最后基于深度可分離卷積,對強化處理后的初級特征進行解碼,輸出檢測結(jié)果。本發(fā)明充分利用圖像的RGB特征與頻率特征,并結(jié)合邊界引導(dǎo)實現(xiàn)對偽裝目標的檢測。
本發(fā)明授權(quán)一種基于深度學(xué)習(xí)的輕量級偽裝目標檢測方法在權(quán)利要求書中公布了:1.一種基于深度學(xué)習(xí)的輕量級偽裝目標檢測方法,其特征在于,包括以下步驟: 步驟1.獲取偽裝物體圖像數(shù)據(jù)集,進行預(yù)處理,并劃分為訓(xùn)練集和測試集; 步驟2.將測試集數(shù)據(jù)輸入初級特征提取網(wǎng)絡(luò),進行初級特征提取; 步驟3.依次通過頻譜門控單元、混合注意力機制、全局信息模塊、邊緣感知模塊、邊緣引導(dǎo)模塊,對初級特征進行強化處理,具體過程如下; 步驟3.1.頻譜門控單元接收f1、f2,并分別作為自身輸入,對其中的頻率特征進行學(xué)習(xí),公式如下: 其中,LN為層歸一化,Xf表示頻域圖像信息,F(xiàn)FT表示快速傅里葉變換,IFFT表示快速傅里葉逆變換,MLP為多層感知機,Wc表示可學(xué)習(xí)權(quán)重參數(shù);頻譜門控單元輸出結(jié)果為fi p,i∈{1,2}; 步驟3.2.混合注意力機制共有四處,分別接收來自兩個頻譜門控單元的輸出以及初級特征提取的后兩單元的輸出f3、f4;該模塊通過串行使用通道注意力和空間注意力,加強特征表示,其公式如下: McF=σMLPAvgPoolF+MLPMaxPoolF MsF=σf7×7[AvgPoolMcF;MaxPoolMcF] 其中,F(xiàn)為輸入特征,包含f3,f4,AvgPool表示平均池化操作,MaxPool表示最大池化操作,σ表示sigmoid激活函數(shù),[;]表示拼接操作;混合注意力機制輸出結(jié)果為MsF:包含 步驟3.3.全局信息模塊,接收來自骨干網(wǎng)絡(luò)的輸出f5,公式如下: f′a0=Conv1×1f5 f′a1=Conv3×3,rates=1f5 f′a2=Conv3×3,rates=2f5 f′a3=Conv3×3,rates=3f5 f′a4=Conv3×3,rates=4f5 fa=Conv1×1Catf′a0,f′a1,f′a2,f′a3,f′a4 fhigh=up×2CBRf5+fa 其中,rates表示擴張卷積操作的膨脹率,Cat表示concat操作,up×2表示上采樣倍率為2,CBR是卷積Conv、批標準化BatchNorm、ReLU激活函數(shù)的組合操作;全局信息模塊輸出結(jié)果為fhigh; 步驟3.4.邊緣感知模塊接收來自全局信息模塊的輸出特征fhigh以及骨干網(wǎng)絡(luò)的輸出f1,作為自身輸入,進行物體邊緣識別;該模塊首先采用兩個1×1卷積層改變通道數(shù),并對fhigh進行上采樣;其次,將處理后的f1和fhigh進行concat拼接操作;最后,通過兩個3×3卷積層和一個1×1帶激活函數(shù)的卷積層得到有效的邊緣特征,輸出結(jié)果為邊緣預(yù)測圖fe; 步驟3.5.邊緣引導(dǎo)模塊接收來自邊緣感知模塊的輸出fe,并結(jié)合來自各級混合注意力機制的輸出增強物體結(jié)構(gòu)的特征代表性;該模塊首先使用元素乘積、殘差連接、3×3卷積得到融合特征圖;再將該融合特征圖通過全局平均池化GAP、一維卷積、Sigmoid激活函數(shù),并與未處理過的特征圖進行元素乘積,最后通過1×1卷積得到最終輸出,公式如下: 其中,D表示下采樣,表示元素級相加,表示元素級相乘,是卷積核大小為1的1D卷積,σ是Sigmoid激活函數(shù),邊緣引導(dǎo)模塊輸出結(jié)果為fi a,i∈{1,2,3,4}; 步驟4.基于深度可分離卷積,對強化處理后的初級特征進行解碼,輸出檢測結(jié)果。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人杭州電子科技大學(xué),其通訊地址為:310018 浙江省杭州市錢塘區(qū)白楊街道2號大街1158號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。