杭州海康威視數字技術股份有限公司張競一獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉杭州海康威視數字技術股份有限公司申請的專利圖像篡改檢測大模型訓練方法及電子設備獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120164087B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510646270.8,技術領域涉及:G06V20/00;該發明授權圖像篡改檢測大模型訓練方法及電子設備是由張競一;張鵬;楊世才;謝迪;朱江設計研發完成,并于2025-05-19向國家知識產權局提交的專利申請。
本圖像篡改檢測大模型訓練方法及電子設備在說明書摘要公布了:本申請公開了一種圖像篡改檢測大模型訓練方法及電子設備,圖像篡改檢測大模型包括:大語言模型、視覺編碼器、分割解碼器、視覺文本映射器、分類層和定位結構;在預訓練階段,凍結大語言模型、視覺編碼器以及視覺文本映射器的參數,通過帶有篡改分類信息和篡改定位結果的樣本數據訓練分割解碼器、分類層和定位結構的參數;在分類訓練階段,凍結大語言模型和視覺編碼器的參數,將樣本數據轉化成帶有篡改分類結果和篡改定位特征的文本信息,訓練分割解碼器、視覺文本映射器、分類層和定位結構的參數;在任務訓練階段,解凍圖像篡改檢測大模型的全局結構,通過帶有篡改分類結果的樣本數據微調圖像篡改檢測大模型的所有參數。
本發明授權圖像篡改檢測大模型訓練方法及電子設備在權利要求書中公布了:1.一種圖像篡改檢測大模型訓練方法,其特征在于,包括: 所述圖像篡改檢測大模型包括:大語言模型、提示詞嵌入層、視覺編碼器、分割解碼器、視覺文本映射器、分類層和定位結構; 在預訓練階段,凍結所述大語言模型、所述視覺編碼器以及所述視覺文本映射器的參數,通過帶有篡改分類信息和篡改定位結果的樣本數據訓練所述分割解碼器、所述分類層和所述定位結構的參數; 在分類訓練階段,凍結所述大語言模型和所述視覺編碼器的參數,將所述樣本數據轉化成帶有篡改分類結果和篡改定位特征的文本信息,訓練所述分割解碼器、所述視覺文本映射器、所述分類層和所述定位結構的參數;所述視覺文本映射器包括第一視覺文本映射器和第二視覺文本映射器,通過所述視覺編碼器,將所述樣本數據中的篡改人臉圖像轉化為帶有篡改區域數據的特征圖,將所述特征圖中的篡改區域數據通過分割解碼器轉化為篡改特征,通過定位結構的線性映射和激活函數將所述篡改特征轉化為分割特征;通過所述分類層將所述篡改特征轉化為篡改分類結果; 通過第一視覺文本映射器,將所述分割特征轉化為分割提示; 通過第二視覺文本映射器,將視覺編碼器輸出的特征圖轉化成視覺提示; 通過所述提示詞嵌入層將所述樣本數據中的問題轉化成問題提示; 將所述篡改分類結果和預設的提示詞的文本特征相乘得到分類提示; 把所述分割提示、所述視覺提示、所述問題提示和所述分類提示分別輸入所述大語言模型對所述大語言模型進行篡改知識注入; 在任務訓練階段,解凍所述圖像篡改檢測大模型的全局結構,通過帶有篡改分類結果的樣本數據微調所述圖像篡改檢測大模型的所有參數。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州海康威視數字技術股份有限公司,其通訊地址為:310051 浙江省杭州市濱江區阡陌路555號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。