沈陽建筑大學袁帥獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉沈陽建筑大學申請的專利一種基于互相關自注意力機制的目標特征提取方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115131551B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210778826.5,技術領域涉及:G06V10/25;該發明授權一種基于互相關自注意力機制的目標特征提取方法是由袁帥;許景科;欒方軍;張笑聞設計研發完成,并于2022-06-30向國家知識產權局提交的專利申請。
本一種基于互相關自注意力機制的目標特征提取方法在說明書摘要公布了:本發明涉及目標檢測和識別技術領域,公開了一種基于互相關自注意力機制的目標特征提取方法,具體包括首先輸入大小為H*W*C的特征圖Z;然后對特征圖進行窗口劃分操作;再對線性層擴張通道維度為2*C,沿通道維度劃分矩陣為矩陣M和矩陣V;獲取互相關矩陣和激活操作;再進行自注意力計算和進行通道注意力計算;最后輸出大小為H*W*C的特征圖Y。本發明尋找特征圖中元素間的相關性,獲取目標的相似特征,同時令通道間信息共享,實現空間維度和通道維度的注意力區域選取。本發明提高了模型對圖像中待測信息的識別效果,提升了模型的識別精度。
本發明授權一種基于互相關自注意力機制的目標特征提取方法在權利要求書中公布了:1.一種基于互相關自注意力機制的目標特征提取方法,其特征在于,具體按以下步驟執行: S1:首先輸入大小為H*W*C的特征圖Z; S2:對特征圖進行窗口劃分操作;具體按以下步驟執行: S2.1:將輸入張量沿長和寬的方向每n個像素劃分為一組,每一個窗口的大小為n*n; S2.2:將窗口中的三維張量從H*W*C延展為HW*1*C; S3:線性層擴張通道維度為2*C,沿通道維度劃分矩陣為矩陣M和矩陣V; 將擴充后的張量沿通道維度切分為兩部分,其中M矩陣和V矩陣中的每一列如式(1)和式(2): 式(1) 式(2) 其中,,C表示矩陣的通道數; S4:獲取互相關矩陣;具體按以下步驟執行: S4.1:將M矩陣中每一列向量復制為H*W列,再將復制后得到的大小為(H*W)*(H*W)的矩陣復制為兩份,并將其中一份進行轉置,最后將復制后的矩陣和其轉置矩陣相減,獲得了M矩陣中每個元素的差異,該矩陣定義為Mdis; S4.2:將Mdis矩陣中每個通道對應位置元素相加,獲得的分子矩陣為; S4.3:將分母矩陣定義為,其表達式如式(3): 式(3) S4.4:將分子矩陣除分母矩陣,獲得相似性矩陣,計算式如式(4); 式(4) S4.5:將矩陣使用1*1大小的卷積核進行卷積操作; S5:激活操作;具體按以下步驟執行;將卷積后的張量使用激活函數進行激活,將激活函數定義如式(5); =式(5) 其中,X為輸入張量,為通過激活函數后的矩陣; S6:進行自注意力計算;具體按以下步驟執行:將激活后的矩陣與矩陣V進行點積運算;將運算后的張量結果進行重新排列為H*W*C;再將重新排列的結果與通道注意力機制得到的通道權重進行對應通道相乘; S7:進行通道注意力計算; S8:具體通過運行YOLOv5網絡模型,運行步驟如下: S8.1:獲取數據集,并將數據集進行Mosaic數據增強;將增強后的數據送入網絡中進行訓練; S9:優化算法采用隨機梯度下降算法SGD作為優化器,以16張圖片作為一個訓練批次,模型初始學習率為1e-2,權重衰減參數為5e-4,且動量為0.937,訓練300個epoch,在模型訓練的初始階段,采用3個epoch進行熱身訓練; S10:訓練模型后對圖片進行預測,得到結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人沈陽建筑大學,其通訊地址為:110623 遼寧省沈陽市渾南區渾南中路25號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。