杭州海康威視數字技術股份有限公司朱江獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉杭州海康威視數字技術股份有限公司申請的專利模型訓練方法、法律問題分析方法及電子設備獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120105108B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510578269.6,技術領域涉及:G06F40/30;該發明授權模型訓練方法、法律問題分析方法及電子設備是由朱江;任文奇;任燁;李紹輝;王嘉偉;曹達設計研發完成,并于2025-05-06向國家知識產權局提交的專利申請。
本模型訓練方法、法律問題分析方法及電子設備在說明書摘要公布了:本申請公開了一種模型訓練方法,包括:將法律問題的生成式樣本數據輸入大語言模型,重構成檢索式樣本數據;將檢索式樣本數據輸入自回歸基座模型,基于QLoRA微調技術訓練自回歸基座模型,其中,自回歸基座模型的訓練損失函數采用帶有忽略損失機制的交叉熵損失函數;將自回歸基座模型的輸出概率分布作為目標分布,依據檢索式樣本數據,訓練檢索模型。本申請能夠解決大語言模型答復法律問題準確性不高的問題。
本發明授權模型訓練方法、法律問題分析方法及電子設備在權利要求書中公布了:1.一種模型訓練方法,其特征在于,包括: 大語言模型結合三維獨熱向量判斷法律問題的類型,其中,所述法律問題的類型包括:生成式法律問題和檢索式法律問題; 通過所述大語言模型判斷所述法律問題是否需要檢索: 在所述法律問題不需要進行檢索時,判定所述法律問題的類型為生成式法律問題; 在所述法律問題需要進行檢索時,基于結合三維獨熱向量的位置索引判斷所述法律問題的檢索類型屬于法條檢索和或類案檢索; 將所述法律問題的生成式樣本數據輸入大語言模型,重構成檢索式樣本數據;將所述檢索式樣本數據輸入自回歸基座模型,基于QLoRA微調技術獲取所述檢索式樣本數據的模型角色數據和回溯標簽包裹的數據,以生成最小交叉熵損失為目的,訓練所述自回歸基座模型學習所述檢索式樣本數據的條件概率分布,其中,所述自回歸基座模型的訓練損失函數采用帶有忽略損失機制的交叉熵損失函數,所述帶有忽略損失機制的交叉熵損失函數的計算公式為: ; ; 其中,表示樣本數據中的所有詞匯,t表征模型訓練的第t個時刻,可以理解為訓練數據中第t個單詞的訓練時間位置,表征第t個時刻樣本數據的真值是里面的第i個值,表征模型的t時刻預測出來為的概率,表征第t個時刻應該是否應該對損失進行掩碼,時刻表征:提示詞和用戶問題不需要調用檢索模型;表征檢索內容的下標位置,是序列長度;表征檢索標簽的時間步;表征模型輸出的時間步; 將所述自回歸基座模型的輸出概率分布作為目標分布,依據所述檢索式樣本數據,訓練檢索模型; 在所述自回歸基座模型判斷出所述檢索式樣本數據表征不需要進行檢索時,不對所述檢索模型進行訓練。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州海康威視數字技術股份有限公司,其通訊地址為:310051 浙江省杭州市濱江區阡陌路555號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。