湖南師范大學王學平獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉湖南師范大學申請的專利一種基于噪聲魯棒提示學習框架的重識別模型訓練方法及系統(tǒng)獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN120148072B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-09-09發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202510541991.2,技術領域涉及:G06V40/10;該發(fā)明授權一種基于噪聲魯棒提示學習框架的重識別模型訓練方法及系統(tǒng)是由王學平;王龍軒;羅世喜;劉敏;劉帥設計研發(fā)完成,并于2025-04-28向國家知識產(chǎn)權局提交的專利申請。
本一種基于噪聲魯棒提示學習框架的重識別模型訓練方法及系統(tǒng)在說明書摘要公布了:本發(fā)明涉及重識別模型處理領域,公開了一種基于噪聲魯棒提示學習框架的重識別模型訓練方法及系統(tǒng),包括:基于預訓練的CLIP模型生成全局視覺特征,基于樣本鄰域信息計算上下文視覺特征;通過可學習的映射網(wǎng)絡轉換為偽語言提示詞構建自適應提示,整合成綜合性文本嵌入;通過跨注意力模塊優(yōu)化提示,使用廣義交叉熵損失與對稱對比損失提升對噪聲標簽的魯棒性;通過提示驅動的知識蒸餾,利用學習到的文本嵌入作為類別向量指導模型優(yōu)化,并使學生模型輸出與教師模型對齊;通過身份損失、三元組損失和知識蒸餾損失函數(shù)對重識別模型進行訓練;本發(fā)明解決了現(xiàn)有的行人重識別模型在噪聲標簽下性能下降的問題,提升了噪聲環(huán)境中的識別精度和魯棒性。
本發(fā)明授權一種基于噪聲魯棒提示學習框架的重識別模型訓練方法及系統(tǒng)在權利要求書中公布了:1.一種基于噪聲魯棒提示學習框架的重識別模型訓練方法,其特征在于,包括: 利用預訓練CLIP模型的視覺編碼器提取輸入行人圖像的全局視覺特征,并在特征空間中檢索目標樣本的全局視覺特征的k個最近鄰全局視覺特征,基于余弦相似度加權聚合生成上下文視覺特征; 通過可學習的映射網(wǎng)絡將全局視覺特征和上下文視覺特征映射為全局偽語言提示詞和上下文偽語言提示詞; 結合預定義的基礎提示模板與全局偽語言提示詞和上下文偽語言提示詞,構建全局文本提示和上下文文本提示,并基于預訓練CLIP模型的文本編碼器生成全局文本嵌入和上下文文本嵌入; 基于最大池化策略融合所述全局文本嵌入與上下文文本嵌入,形成綜合性文本嵌入; 引入語言引導的跨注意力模塊,將所述綜合性文本嵌入作為查詢向量,視覺編碼器輸出的圖塊嵌入作為鍵向量和值向量,優(yōu)化多模態(tài)特征表示;采用廣義交叉熵損失函數(shù)與對稱對比損失函數(shù)聯(lián)合優(yōu)化模型參數(shù),提升對噪聲標簽的魯棒性; 將所述綜合性文本嵌入作為類別語義向量,通過提示模仿策略使學生重識別模型的視覺特征分布與教師模型的文本特征分布對齊;基于身份分類損失、三元組邊界損失及語義知識蒸餾損失聯(lián)合訓練學生模型; 使用訓練完成的重識別模型的視覺編碼器提取測試集中查詢圖像與圖庫圖像的視覺特征,結合教師模型生成的文本特征計算跨模態(tài)相似度;根據(jù)相似度得分對圖庫樣本進行排序,輸出與查詢圖像匹配的目標身份,完成行人重識別任務。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或專利權人湖南師范大學,其通訊地址為:410081 湖南省長沙市岳麓區(qū)麓山路36號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。