湖南師范大學王學平獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉湖南師范大學申請的專利一種基于噪聲魯棒提示學習框架的重識別模型訓練方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120148072B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510541991.2,技術領域涉及:G06V40/10;該發明授權一種基于噪聲魯棒提示學習框架的重識別模型訓練方法及系統是由王學平;王龍軒;羅世喜;劉敏;劉帥設計研發完成,并于2025-04-28向國家知識產權局提交的專利申請。
本一種基于噪聲魯棒提示學習框架的重識別模型訓練方法及系統在說明書摘要公布了:本發明涉及重識別模型處理領域,公開了一種基于噪聲魯棒提示學習框架的重識別模型訓練方法及系統,包括:基于預訓練的CLIP模型生成全局視覺特征,基于樣本鄰域信息計算上下文視覺特征;通過可學習的映射網絡轉換為偽語言提示詞構建自適應提示,整合成綜合性文本嵌入;通過跨注意力模塊優化提示,使用廣義交叉熵損失與對稱對比損失提升對噪聲標簽的魯棒性;通過提示驅動的知識蒸餾,利用學習到的文本嵌入作為類別向量指導模型優化,并使學生模型輸出與教師模型對齊;通過身份損失、三元組損失和知識蒸餾損失函數對重識別模型進行訓練;本發明解決了現有的行人重識別模型在噪聲標簽下性能下降的問題,提升了噪聲環境中的識別精度和魯棒性。
本發明授權一種基于噪聲魯棒提示學習框架的重識別模型訓練方法及系統在權利要求書中公布了:1.一種基于噪聲魯棒提示學習框架的重識別模型訓練方法,其特征在于,包括: 利用預訓練CLIP模型的視覺編碼器提取輸入行人圖像的全局視覺特征,并在特征空間中檢索目標樣本的全局視覺特征的k個最近鄰全局視覺特征,基于余弦相似度加權聚合生成上下文視覺特征; 通過可學習的映射網絡將全局視覺特征和上下文視覺特征映射為全局偽語言提示詞和上下文偽語言提示詞; 結合預定義的基礎提示模板與全局偽語言提示詞和上下文偽語言提示詞,構建全局文本提示和上下文文本提示,并基于預訓練CLIP模型的文本編碼器生成全局文本嵌入和上下文文本嵌入; 基于最大池化策略融合所述全局文本嵌入與上下文文本嵌入,形成綜合性文本嵌入; 引入語言引導的跨注意力模塊,將所述綜合性文本嵌入作為查詢向量,視覺編碼器輸出的圖塊嵌入作為鍵向量和值向量,優化多模態特征表示;采用廣義交叉熵損失函數與對稱對比損失函數聯合優化模型參數,提升對噪聲標簽的魯棒性; 將所述綜合性文本嵌入作為類別語義向量,通過提示模仿策略使學生重識別模型的視覺特征分布與教師模型的文本特征分布對齊;基于身份分類損失、三元組邊界損失及語義知識蒸餾損失聯合訓練學生模型; 使用訓練完成的重識別模型的視覺編碼器提取測試集中查詢圖像與圖庫圖像的視覺特征,結合教師模型生成的文本特征計算跨模態相似度;根據相似度得分對圖庫樣本進行排序,輸出與查詢圖像匹配的目標身份,完成行人重識別任務。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人湖南師范大學,其通訊地址為:410081 湖南省長沙市岳麓區麓山路36號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。