溫州電力設計有限公司普華招標咨詢分公司鄭明獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉溫州電力設計有限公司普華招標咨詢分公司申請的專利一種目標識別方法、系統、電子設備和存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119785007B 。
龍圖騰網通過國家知識產權局官網在2025-09-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411925172.X,技術領域涉及:G06V10/25;該發明授權一種目標識別方法、系統、電子設備和存儲介質是由鄭明;夏震宇;林躍進;呂家輝;葉海娟;陳瀅;徐歡;趙舒雷;李彬旗設計研發完成,并于2024-12-25向國家知識產權局提交的專利申請。
本一種目標識別方法、系統、電子設備和存儲介質在說明書摘要公布了:本發明公開了一種目標識別方法、系統、電子設備和存儲介質,涉及圖像識別技術領域,方法包括:構建目標識別模型,目標識別模型包括:編碼器、解碼器和檢測頭;編碼器用于:利用卷積層和自注意力機制,獲取樣本圖像在不同階段的圖像特征;解碼器用于:對樣本圖像在不同階段的圖像特征進行漸進融合,對最終融合圖像特征賦予不同權重,再進行特征增強操作,得到增強后的最終融合圖像特征,檢測頭用于:對增強后的最終融合圖像特征進行處理,得到樣本圖像的目標識別結果;對目標識別模型進行訓練,得到訓練好的目標識別模型;利用訓練好的目標識別模型對預設圖像進行識別,得到預設圖像的目標識別結果。
本發明授權一種目標識別方法、系統、電子設備和存儲介質在權利要求書中公布了:1.一種目標識別方法,其特征在于,包括: 構建目標識別模型,所述目標識別模型包括:編碼器、解碼器和檢測頭,所述編碼器用于:利用卷積層和自注意力機制,獲取樣本圖像在不同階段的圖像特征,所述解碼器用于:對所述樣本圖像在不同階段的圖像特征進行漸進融合,對最終融合圖像特征賦予不同權重,再進行特征增強操作,得到增強后的最終融合圖像特征,所述檢測頭用于:對所述增強后的最終融合圖像特征進行處理,得到所述樣本圖像的目標識別結果; 對所述目標識別模型進行訓練,得到訓練好的目標識別模型; 利用所述訓練好的目標識別模型對預設圖像進行識別,得到所述預設圖像的目標識別結果; 所述解碼器具體用于:利用膨脹卷積層、分塊反向注意力機制模塊和卷積層,對所述樣本圖像在不同階段的圖像特征進行漸進融合,對最終融合圖像特征賦予不同權重,再進行特征增強操作,得到增強后的最終融合圖像特征; 所述編碼器包括依次設置的第一卷積層、第一自注意力機制模塊、第二自注意力機制模塊和第三自注意力機制模塊;第一自注意力機制模塊、第二自注意力機制模塊和第三自注意力機制模塊用于通過自注意力機制對各個接收到的數據進行處理; 將所述第一卷積層的輸出作為所述第一自注意力機制模塊的輸入; 將所述第一自注意力機制模塊的輸出作為所述第二自注意力機制模塊的輸入; 將所述第二自注意力機制模塊的輸出作為所述第三自注意力機制模塊的輸入; 樣本圖像在不同階段的圖像特征包括:所述第一卷積層的輸出、所述第一自注意力機制模塊的輸出、所述第二自注意力機制模塊的輸出和所述第三自注意力機制模塊的輸出; 所述解碼器包括依次設置的第一膨脹卷積層、第一分塊反向注意力機制模塊、第二膨脹卷積層、第二分塊反向注意力機制模塊、第二卷積層、第三分塊反向注意力機制模塊、第三卷積層、第四分塊反向注意力機制模塊、緊湊度度量模塊和特征增強模塊; 將所述第三自注意力機制模塊的輸出作為所述第一膨脹卷積層的輸入; 將所述第一卷積層的輸出還作為第四分塊反向注意力機制模塊的輸入; 將所述第一自注意力機制模塊的輸出還作為所述第三分塊反向注意力機制模塊的輸入; 將所述第二自注意力機制模塊的輸出還作為所述第二分塊反向注意力機制模塊的輸入; 將所述第三自注意力機制模塊的輸出作為所述第一膨脹卷積層的輸入,并作為所述第一分塊反向注意力機制模塊的輸入; 將所述第一膨脹卷積層的輸出作為所述第一分塊反向注意力機制模塊的輸入; 將所述第一分塊反向注意力機制模塊的輸出作為所述第二膨脹卷積層的輸入; 將所述第二膨脹卷積層的輸出作為所述第二分塊反向注意力機制模塊的輸入; 將所述第二分塊反向注意力機制模塊的輸出作為所述第二卷積層的輸入; 將所述第二卷積層的輸出作為所述第三分塊反向注意力機制模塊的輸入; 將所述第三分塊反向注意力機制模塊的輸出作為所述第三卷積層的輸入; 將所述第三卷積層的輸出作為所述第四分塊反向注意力機制模塊的輸入; 所述第一分塊反向注意力機制模塊、所述第二分塊反向注意力機制模塊、所述第三分塊反向注意力機制模塊和所述第四分塊反向注意力機制模塊用于對各自接收到的數據進行特征融合; 所述第四分塊反向注意力機制模塊的輸出為所述最終融合圖像特征,將所述最終融合圖像特征輸入所述緊湊度度量模塊,所述緊湊度度量模塊對所述最終融合圖像特征進行注意力操作后,并賦予不同權重,再經過所述特征增強模塊進行特征增強操作,得到所述增強后的最終融合圖像特征; 其中,每個自注意力機制模塊的數據處理過程如下: S11、自注意力機制模塊分別利用兩個逐點卷積層將接收到的特征進行處理,得到第一中間特征圖I1和第二中間特征圖I2,其中,接收到的特征為I,I∈R{H′×W′×C′}; S12、對第一中間特征圖I1和第二中間特征圖I2進行形狀重塑操作,然后通過全連接層獲取形狀重塑后的第一中間特征圖I1的注意力特征輸入q和形狀重塑后的第二中間特征圖I2的注意力特征輸入k,具體通過如下公式實現: q=FCreshapeI1 k=FCreshapeI2 其中,q∈R{H′×1},k∈R{1×H′},reshapeI1表示:對第一中間特征圖I1進行形狀重塑操作,FCreshapeI1表示:通過全連接層獲取形狀重塑后的第一中間特征圖I1的注意力特征輸入q,reshapeI2表示:對第二中間特征圖I2進行形狀重塑操作,FCreshapeI2表示:通過全連接層獲取形狀重塑后的第二中間特征圖I2的注意力特征輸入k; S13、對形狀重塑后的第一中間特征圖I1的注意力特征輸入q和形狀重塑后的第二中間特征圖I2的注意力特征輸入k進行矩陣相乘,并進行逐點卷積和softmax操作后,得到注意力矩陣attention; S14、通過卷積層對接收到的特征I進行處理,計算得到卷積特征Iconv; S15、將注意力矩陣attention與卷積特征Iconv逐通道相乘得到注意力輸出特征Oattention; S16、最后對接收到的特征I、卷積特征Iconv和注意力輸出特征Oattention進行特征融合,得到融合后的特征 S17、根據融合后的特征得到最終輸出特征O: 其中, 表示:利用卷積層對融合后的特征進行卷積操作,表示:通過逐點卷積層對融合后的特征進行逐點卷積操作,表示:對和相加; 分塊反向注意力機制模塊的數據處理過程為:首先通過將深層特征上采樣與淺層特征空間維度一致,通過ResNet34模型以及全連接層對輸入目標圖像進行分塊,對生成圖像通過Sigmoid激活函數后,使用全一向量減去該特征圖,得到分塊反向注意力權重,并在淺層特征上施加該權重以融合深層特征,進而通過卷積操作與殘差連接獲取特征圖,具體包括如下步驟: S20、對于上一層輸出特征圖out進行通道維度的上采樣操作,達到與淺層特征相同通道數的特征Outupsample: Outupsample=Upsampleout 其中,Upsampleout表示對Outupsample進行上采樣操作,第一分塊反向注意力機制模塊的上一層輸出特征圖為:第一膨脹卷積層的輸出,第二分塊反向注意力機制模塊的上一層輸出特征圖為:第二膨脹卷積層的輸出,第三分塊反向注意力機制模塊的上一層輸出特征圖為:第二卷積層的輸出,第四分塊反向注意力機制模塊的上一層輸出特征圖為:第三卷積層的輸出; S21、利用ResNet34模型以及全連接層操作進行目標目標識別,識別到目標后,定位目標中心Outcenter: Outcenter=FCResNet34FCBNLeakyReLUOutupsample 其中,ResNet·表示ResNet34模型,BN·表示批量歸一化操作,LeakyReLU·表示激活函數操作; S22、根據目標中心Outcenter,將每個通道特征圖分割為32×32的目標圖像,最終獲取分塊目標圖像Outconc: Outconc=FGOutcenter 其中,FGOutcenter表示:對目標圖像分割操作; S23、對分塊后的目標圖像執行Sigmoid操作,使特征圖進行壓縮,得到壓縮后的目標圖像OutSigmoid; S24、通過全一向量減去特征圖OutSigmoid,得到反向注意力特征圖權重Weightra; S25、將反向注意力特征圖權重Weightra與對應位置的淺層特征進行逐點相乘,得到加權卷積特征Weighti: 其中,表示逐點相乘,目標識別模型包括11層,第1層為:第一卷積層,第2層為第一自注意力機制模塊,第3層為第二自注意力機制模塊,第4層為第三自注意力機制模塊,第5層為第一膨脹卷積層,第6層為第二膨脹卷積層,第7層為第二卷積層,第8層為第三卷積層,第9層為緊湊度度量模塊,第10層為特征增強模塊,第11層為檢測頭,在應用第i個應用分塊反向注意力機制模塊時,結合對應位置第5-i層網絡對應的淺層特征輸出F{5-i},第一分塊反向注意力機制模塊結合第三自注意力機制模塊的輸出進行處理,第二分塊反向注意力機制模塊結合第二自注意力機制模塊的輸出進行處理,第三分塊反向注意力機制模塊結合第一自注意力機制模塊的輸出進行處理,第四分塊反向注意力機制模塊結合第一卷積層的輸出進行處理; 通過將加權卷積特征Weighti通過卷積操作與上一層輸出相加,獲得殘差相加圖像out1,以補充在深層網絡中特征消失的細節: out1=ConvWeighti+OutUpsample 然后提取增強后的最終融合圖像特征F即特征圖,具體通過如下計算公式實現: F=DConvConvWeightcompact 其中,DConv·表示:膨脹卷積操作,Clusterj表示:第j組的中所有像素點之間的平均歐式距離Clusterj,xl,yl表示:表示第l個像素點的坐標,xr,yr表示:第r個像素點的坐標,labelj表示:第j組標簽,sumj表示:第j組的中所有像素點之間的平均歐式距離之和。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人溫州電力設計有限公司普華招標咨詢分公司,其通訊地址為:325000 浙江省溫州市飛霞橋路68號國信大廈22層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。