哈爾濱工業大學(深圳)(哈爾濱工業大學深圳科技創新研究院)劉學博獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉哈爾濱工業大學(深圳)(哈爾濱工業大學深圳科技創新研究院)申請的專利基于預設錯誤模式的大語言模型負樣本增強偏好優化方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120448546B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510950747.1,技術領域涉及:G06F16/35;該發明授權基于預設錯誤模式的大語言模型負樣本增強偏好優化方法是由劉學博;廖蘊杰;饒雋;張民設計研發完成,并于2025-07-10向國家知識產權局提交的專利申請。
本基于預設錯誤模式的大語言模型負樣本增強偏好優化方法在說明書摘要公布了:本發明提供一種基于預設錯誤模式的大語言模型負樣本增強偏好優化方法及裝置,涉及大語言處理技術領域。該方法包括:基于對話問答場景,采集對話問題以及問題對應正確回答的數據,獲得正樣本數據集;定義大語言模型回答的錯誤類型;根據錯誤類型構建錯誤描述文本;基于自監督錯誤注入機制,根據錯誤描述文本以及正樣本數據集,使用目標大語言模型進行數據生成,獲得負樣本數據集;使用正樣本數據集以及負樣本數據集,對目標大語言模型進行KTO偏好優化訓練,獲得優化大語言模型。本發明是一種基于錯誤模式的效率高且魯棒性好的大語言模型負樣本增強偏好優化方法。
本發明授權基于預設錯誤模式的大語言模型負樣本增強偏好優化方法在權利要求書中公布了:1.一種基于預設錯誤模式的大語言模型負樣本增強偏好優化方法,其特征在于,所述方法包括: 基于對話問答場景,采集對話問題以及問題對應正確回答的數據,獲得正樣本數據集; 定義大語言模型回答的錯誤類型;根據錯誤類型構建錯誤描述文本; 其中,所述錯誤類型用于覆蓋大語言模型回答的錯誤種類;所述錯誤類型包括正確性錯誤、邏輯性錯誤和幻覺錯誤; 所述正確性錯誤是指不符合客觀事實或邏輯規則的響應錯誤;所述邏輯性錯誤是指推理鏈條存在缺陷的響應錯誤;所述幻覺錯誤是指虛構無事實依據的響應錯誤; 所述錯誤類型為負樣本數據集的生成提供明確靶向; 基于自監督錯誤注入機制,根據錯誤描述文本以及正樣本數據集,使用目標大語言模型進行數據生成,獲得負樣本數據集; 其中,所述基于自監督錯誤注入機制,根據錯誤描述文本以及正樣本數據集,使用目標大語言模型進行數據生成,獲得負樣本數據集,包括: 基于預設的錯誤注入規則,根據錯誤描述文本構建錯誤注入提示文本; 基于錯誤注入提示文本,根據正樣本數據集,使用目標大語言模型進行定向錯誤類型數據生成,獲得注入錯誤數據集; 基于錯誤描述文本,根據注入錯誤數據集,使用目標大語言模型進行錯誤類型校驗,獲得校驗結果; 根據校驗結果,對注入錯誤數據集進行篩選優化,獲得負樣本數據集; 使用正樣本數據集以及負樣本數據集,對目標大語言模型進行KTO偏好優化訓練,獲得優化大語言模型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人哈爾濱工業大學(深圳)(哈爾濱工業大學深圳科技創新研究院),其通訊地址為:518000 廣東省深圳市南山區桃源街道深圳大學城哈爾濱工業大學校區;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。