暨南大學黃斐然獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網獲悉暨南大學申請的專利一種基于大語言模型的實體消歧和遺忘方法及系統(tǒng)獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產權局授予,授權公告號為:CN120011534B 。
龍圖騰網通過國家知識產權局官網在2025-08-26發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202411932523.X,技術領域涉及:G06F16/334;該發(fā)明授權一種基于大語言模型的實體消歧和遺忘方法及系統(tǒng)是由黃斐然;徐沖;劉文驍;周志博;劉志全設計研發(fā)完成,并于2024-12-26向國家知識產權局提交的專利申請。
本一種基于大語言模型的實體消歧和遺忘方法及系統(tǒng)在說明書摘要公布了:本發(fā)明公開了一種基于大語言模型的實體消歧和遺忘方法及系統(tǒng),涉及自然語言處理的實體消歧技術領域,包括;確定實體消歧數據集和遺忘數據集,構建對比學習樣本并進行數據預處理;利用LLaMA3模型提取特征,添加投影層和對比學習模塊;通過構建損失函數,對于每個樣本,使用余弦相似度計算其特征表示與正負樣本的相似度,使用對比損失來度量模型在區(qū)分正負樣本的效果;基于損失值,通過反向傳播更新模型參數,直到模型收斂。本發(fā)明以LLaMA3模型基礎架構,基于對比學習的方法增強了模型的判別能力,同時提供了實現(xiàn)遺忘機制的途徑。本發(fā)明為模型在自然語言處理領域的研究和應用提供新的思路。
本發(fā)明授權一種基于大語言模型的實體消歧和遺忘方法及系統(tǒng)在權利要求書中公布了:1.一種基于大語言模型的實體消歧和遺忘方法,其特征在于,包括以下步驟: 基于實體消歧數據集和遺忘數據集,構建對比學習樣本后,進行數據預處理除去無關信息,使用LLaMA3模型的詞匯表,對文本進行分詞和編碼,生成數據集; 基于所述LLaMA3模型,通過添加投影層和對比學習模塊進行改進,并依據改進后的所述LLaMA3模型,根據所述數據集進行模型訓練,構建大語言模型,使得構建的所述大語言模型同時具備實體消歧和遺忘的能力; 在對LLaMA3模型進行改進的過程中,在LLaMA3模型的輸出層之后添加一個投影層,將高維的文本表示映射到對比學習空間,集成對比學習所需的模塊,包括對比損失計算和正負樣本匹配; 在進行模型訓練的過程中,對于每個樣本,使用余弦相似度計算其特征表示與正樣本和負樣本的相似度,使用對比損失來度量模型在區(qū)分正負樣本方面的效果; 在使用對比損失來度量模型在區(qū)分正負樣本方面的效果的過程中,利用對比學習的損失函數InfoNCE損失來訓練模型區(qū)分正負樣本,公式如下: ,其中,表示樣本i,表示樣本i的正樣本,表示樣本i的負樣本,包括需要遺忘的實體,表示相似度函數,表示溫度超參數。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或專利權人暨南大學,其通訊地址為:510632 廣東省廣州市天河區(qū)黃埔大道西601號;或者聯(lián)系龍圖騰網官方客服,聯(lián)系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。