廈門大學曹劉娟獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉廈門大學申請的專利基于自適應數據選取與文本融合的半監督偽裝目標檢測方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120318661B 。
龍圖騰網通過國家知識產權局官網在2025-09-02發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510788597.9,技術領域涉及:G06V20/00;該發明授權基于自適應數據選取與文本融合的半監督偽裝目標檢測方法是由曹劉娟;張聲傳;顏瑋琦;陳綠海;張巖設計研發完成,并于2025-06-13向國家知識產權局提交的專利申請。
本基于自適應數據選取與文本融合的半監督偽裝目標檢測方法在說明書摘要公布了:本發明公開一種基于自適應數據選取與文本融合的半監督偽裝目標檢測方法,利用自適應數據增強技術和文本融合策略,在僅需少量人工標注數據的條件下進行模型訓練,引導模型學習偽裝目標的深層特征,實現對與背景極為相似的偽裝目標的精確分割,并生成高質量的分割掩碼。具體地,本發明具有自適應數據增強模塊和自適應數據選擇模塊,通過對抗增強和采樣策略,自適應的選取有價值樣本進行標注;以及文本融合模塊,通過結合偽裝知識和視覺?文本交互,實現對有標簽數據的充分利用。實驗結果表明,本發明提出的方法超越了已有的全部半監督偽裝目標檢測方法,有效的證明了其有效性。
本發明授權基于自適應數據選取與文本融合的半監督偽裝目標檢測方法在權利要求書中公布了:1.一種基于自適應數據選取與文本融合的半監督偽裝目標檢測方法,其特征在于包含一個自適應數據增強模塊、一個自適應數據選擇模塊和一個文本融合模塊,并包括以下步驟: 步驟1、使用自適應數據選擇模塊對無標注圖像進行價值評分,根據預設的評分閾值選出適合模型訓練的高價值圖片進行人工標注,構建包含圖像級指向性文本與真實圖像標簽的已標注數據集; 步驟2、首先對待檢測的人工標注的圖像進行預處理,然后使用自適應數據增強模塊獲得自適應數據增強的圖像; 步驟3、將自適應數據增強的圖像輸入教師-學生框架,由視覺特征提取主干網絡提取圖像深度特征;教師-學生框架包括教師模型、學生模型; 步驟4、將圖像深度特征與圖像級指向性文本輸入文本融合模塊以生成文本-視覺融合特征,并由解碼器生成教師模型預測結果與學生模型預測結果; 步驟5、使用真實圖像標簽與學生模型預測結果計算得到整個網絡的總損失,然后通過反向傳播調整視覺特征提取主干網絡、自適應數據增強模塊、文本融合模塊和解碼器的參數; 所述步驟4具體包含以下步驟: 步驟4.1使用指向性文本編碼器對圖像級指向性文本進行編碼,獲得文本特征;指向性文本編碼器使用參數凍結的預訓練CLIP文本編碼器,該文本編碼器不參與模型訓練,僅用于對文本信息進行編碼;上標指代Text;下標指代Labeled,下標表示有標注數據的索引; 步驟4.2對于圖像深度特征,使用線索注意力機制生成線索注意力查詢: ; ; ; 其中,下標表示多層級特征中的第個特征;表示線索查詢向量;表示可學習的查詢;表示線索鍵向量;表示線索值向量;、和表示線性投影權重;表示線索注意力圖;表示的轉置;表示注意力頭的維度;表示softmax激活函數; 步驟4.3對線索注意力查詢與碼本計算余弦相似度分數: ; 其中,表示余弦相似度;表示碼本中的元素;表示一組存儲類別相關的信息的特征向量的碼本; 步驟4.4基于余弦相似度分數對碼本進行加權聚合,生成線索向量: ; 其中,表示計算集合元素個數; 步驟4.5將線索向量插入文本特征中,獲得增強文本特征: ; 其中,表示拼接操作; 步驟4.6對增強文本特征和圖像深度特征使用交叉注意力機制獲得文本-視覺融合特征: ; 其中,表示交叉注意力; 步驟4.7將文本-視覺融合特征輸入解碼器,生成教師模型預測結果與學生模型預測結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廈門大學,其通訊地址為:361000 福建省廈門市思明南路422號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。