浙江大學;浙大城市學院公曉龍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉浙江大學;浙大城市學院申請的專利基于偏見強度的大語言模型細粒度去偏見方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120030133B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510510877.3,技術領域涉及:G06F16/3329;該發明授權基于偏見強度的大語言模型細粒度去偏見方法及系統是由公曉龍;韓志科;況琨設計研發完成,并于2025-04-23向國家知識產權局提交的專利申請。
本基于偏見強度的大語言模型細粒度去偏見方法及系統在說明書摘要公布了:本發明公開了一種基于偏見強度的大語言模型細粒度去偏見方法及系統,屬于生成式人工智能領域。本發明引入了多模型協同的細粒度數據標注方法,通過多個主流大語言模型投票機制量化樣本的偏見強度,解決傳統方法中偏見強度不可測量的問題;另外本發明設計了改進型直接偏好優化損失函數,通過偏見強度加權區分不同偏見的優化權重,并引入概率解耦正則項阻斷中立回答與偏見回答生成概率的同向增長,防止去偏見過程中偏見概率異常升高。本發明實現了細粒度、差異化的去偏見優化,可有效去除大語言模型中的偏見,同時還可以有效提升訓練的穩定性,適用于對話系統、文本生成等場景。
本發明授權基于偏見強度的大語言模型細粒度去偏見方法及系統在權利要求書中公布了:1.一種基于偏見強度的大語言模型細粒度去偏見方法,其特征在于,包括: S1、獲取由去偏見樣本構成的訓練數據集,其中所述去偏見樣本為輸入問題、中立回答與偏見回答組成的三元組,將每個去偏見樣本輸入由多個大語言模型構成的偏見評估模型組中,通過群體決策對三元組內兩個回答中相對更加中立的回答進行多模型投票,并根據多模型投票結果計算該去偏見樣本的偏見強度; S2、利用所述訓練數據集分批次對大語言模型進行迭代微調,實現細粒度去偏見優化并阻斷偏見回答生成概率的提升,使微調后的大語言模型針對用戶提問輸出去偏見的中立回答;每一輪微調過程中,以未經微調的原始大語言模型作為參考模型,以上一輪微調得到的大語言模型作為待優化模型,由參考模型和待優化模型分別基于去偏見樣本中的輸入問題得到去偏見樣本中的中立回答與偏見回答的概率,結合多模型投票結果和偏見強度計算細粒度去偏見損失項和概率解耦正則損失項,以兩個損失項的加權和為總損失并反向優化待優化模型; 通過群體決策進行多模型投票時,將每個去偏見樣本對應的三元組輸入偏見評估模型組中的每個大語言模型中,通過提示詞驅動大語言模型判斷輸入三元組所包含的中立回答與偏見回答中哪一個更加中立并投票,統計偏見評估模型組中所有大語言模型認為中立回答更加中立的第一票數和認為偏見回答更加中立的第二票數,將第一票數和第二票數的差值與加和之間的比值作為該去偏見樣本的偏見強度; 每一輪微調過程中,當前訓練批次中的每個去偏見樣本均需要將所包含的輸入問題輸入參考模型和待優化模型中,獲得模型針對回答文本中每個位置輸出的詞在詞表中的概率分布,從而根據模型輸出以及去偏見樣本中實際的中立回答和偏見回答,計算待優化模型輸出中立回答的第一概率、待優化模型輸出偏見回答的第二概率、參考模型輸出中立回答的第三概率、參考模型輸出偏見回答的第四概率; 所述細粒度去偏見損失項為采用所述偏見強度的絕對值縮放的負對數似然損失,其中似然部分為權重因子、所述偏見強度的符號函數、概率差值相乘后的激活輸出,所述概率差值由所述第一概率與所述第三概率之比的對數減去所述第二概率與所述第四概率之比的對數計算得到; 所述概率解耦正則損失項為負對數似然損失,其中似然部分為權重因子的負數與正則項相乘后的激活輸出,所述正則項為兩個對數項的加權和,第一個加權項為所述第一概率與所述第三概率之比的對數,權重為所述第二票數占第一票數和第二票數之和的比值,第二個加權項為所述第二概率與所述第四概率之比的對數,權重為所述第一票數占第一票數和第二票數之和的比值。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江大學;浙大城市學院,其通訊地址為:310058 浙江省杭州市西湖區余杭塘路866號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。