中國自然資源航空物探遙感中心張智軒獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉中國自然資源航空物探遙感中心申請的專利一種基于多支路卷積注意力模型的光學影像圖像分割方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120259330B 。
龍圖騰網通過國家知識產權局官網在2025-09-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510318946.0,技術領域涉及:G06T7/10;該發明授權一種基于多支路卷積注意力模型的光學影像圖像分割方法是由張智軒;竇菀欣;王寧;楊永鵬;徐蕾;張加洪;范景輝;任秋華設計研發完成,并于2025-03-18向國家知識產權局提交的專利申請。
本一種基于多支路卷積注意力模型的光學影像圖像分割方法在說明書摘要公布了:本發明提供了一種基于多支路卷積注意力模型的光學影像圖像分割方法,其1定義與實例化數據集;2可視化輸入數據;3定義與實例化多支路卷積注意力網絡模型;4訓練多支路卷積注意力網絡模型。本發明提出的多支路卷積注意力模型通過卷積和Transfomer并行的模塊,并且在每個卷積模塊中增加了直接的跳躍連接,同時引入了一種引入了融合模塊,代替常見的拼接操作,其可以有效融合兩條支路所提取的全局信息和局部信息,并對其進行過濾,只保留其中有意義的部分,提高模型效率;多支路卷積注意力模型能更好地保留高層次的語義信息,同時結合低層次的細節信息,得到更精確的分割結果。
本發明授權一種基于多支路卷積注意力模型的光學影像圖像分割方法在權利要求書中公布了:1.一種基于多支路卷積注意力模型的光學影像圖像分割方法,其特征在于,包括以下步驟: (1)定義與實例化CSWV數據集; (2)可視化輸入數據; (3)定義與實例化多支路卷積注意力網絡模型;具體過程為: (3.1)多分支模塊采用支路并行結構,作為多支路卷積注意力網絡模型的主干網絡,其中支路包含卷積分支,即引入了殘差結構的兩層3×3的卷積,每層卷積之后還經過一次批歸一化BN和ReLU激活函數s,最終經過殘差結構,獲得卷積分支輸出的特征圖x c : ; ; ; 另一支路:Transformer分支,與所述卷積分支并行,Transformer分支采用一種輕量化VisionTransformer架構:EdgeVisionTransformers中的Transformer塊,通過引入一種基于自注意力和卷積相結合的優化結構,即高效的“局部-全局-局部”信息交互瓶頸來實現;由此多分支模塊利用卷積分支來提取圖像數據中的局部特征,利用Transformer分支來把握圖像數據中的全局特征;所述“局部-全局-局部”信息交互瓶頸實現的具體過程為: (3.1.1)局部聚合 使用有效的深度卷積從相鄰特征進行局部信息聚集; (3.1.2)全局稀疏注意力 通過自注意力形成一個稀疏的均勻分布的代表特征集,用于遠程信息交換,由此獲得更新的信息; (3.1.3)局部傳播 通過轉置卷積將更新的信息從代表特征擴散到局部鄰域中的非代表特征; (3.1.4)最終獲得Transformer分支輸出的特征圖X out : ; ; ; ; 其中,FFN表示雙層感知器,Norm表示層歸一化操作; (3.2)使用多支路卷積注意力網絡模型的融合模塊替代將多個特征通道在通道維度上進行簡單拼接,用于整合卷積分支與Transformer分支的不同特征;在所述融合模塊中,DO-Conv用于替代傳統的Conv卷積操作; 融合模塊整合卷積分支與Transformer分支的不同特征具體過程為:首先,高層特征被上采樣到與低層特征相同的尺度大小,然后分別使用兩個卷積核大小為1×3和3×1的卷積對所述二者進行過濾和特征提取;接著,應用批量歸一化和激活函數GELU進行進一步處理;隨后,將兩個分支的信息進行拼接,再次通過兩個卷積核大小為1×3和3×1的卷積對所述拼接后的特征進行篩選和過濾,建立互補關系,獲得提取的多層次融合特征X F ;在所述多支路卷積注意力網絡的解碼端,高層特征的類別信息能指導低層特征分類,低層特征的位置信息則補充了高層特征的空間信息; 融合模塊的計算過程如下: ; ; ; ; 其中,X in1 和X in2 分別表示融合模塊的兩個輸入,Y out 表示融合模塊的輸出;DOConv 3×1 表示卷積核大小為n×m的DO-Conv,Up表示雙線性插值2倍上采樣操作,Concat表示基于通道維度上的拼接操作,BN和G分別表示批歸一化和非線性激活函數GELU;GELU的計算公式如下: ; 接下來,在多支路卷積注意力網絡模型的DE解碼器的實現中,首先對提取的多層次融合特征XF進行上采樣操作,使特征圖XF的空間分辨率逐步提升到更高的層級,獲得上采樣后的特征圖X FU ;隨后,分別將每層的X FU 與當前層的X F 合并,通過拼接操作生成新的特征表示X FC ;接著,將X FC 與來自更高層次的特征X F+1 共同輸入到融合模塊中處理; 最終,融合后的特征傳遞給一個分類器即多支路卷積注意力網絡模型的classfilier模塊,進行最終的預測;分類器將最高層的DE解碼器輸出的特征圖通道數壓縮為類別數3,是每個像素點的分類概率,公式為: ; (4)訓練多支路卷積注意力網絡模型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中國自然資源航空物探遙感中心,其通訊地址為:100000 北京市海淀區學院路29號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。