浪潮電子信息產業股份有限公司趙雅倩獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉浪潮電子信息產業股份有限公司申請的專利一種實體鏈接方法、裝置、設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114841164B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210466937.2,技術領域涉及:G06F40/295;該發明授權一種實體鏈接方法、裝置、設備及存儲介質是由趙雅倩;徐聰;郭振華;范寶余;金良;劉璐;閆瑞棟設計研發完成,并于2022-04-29向國家知識產權局提交的專利申請。
本一種實體鏈接方法、裝置、設備及存儲介質在說明書摘要公布了:本申請涉及自然語言處理技術領域,公開了一種實體鏈接方法、裝置、設備及存儲介質,包括:獲取與輸入文本對應的實體提及、候選實體以及實體描述;構建包含實體提及與實體描述的第一融合序列和包含候選實體與輸入文本的第二融合序列;利用第一模型計算實體提及的第一融合序列與第二融合序列的相似度,并根據相似度從候選實體中確定出實體提及的鏈接實體;第三模型為利用訓練文本的實體提及訓練樣本的正樣本和負樣本通過對比學習的方式對采用對比損失函數的預訓練模型進行訓練得到。本申請在實體鏈接中融入實體描述信息,同時通過正負樣本對比學習的方式訓練模型來實現實體消歧,提高實體鏈接準確度以及在開放知識圖譜上進行實體鏈接的性能。
本發明授權一種實體鏈接方法、裝置、設備及存儲介質在權利要求書中公布了:1.一種實體鏈接方法,其特征在于,包括: 將獲取實體提及的第二模型、獲取候選實體的第三模型和第一模型集成至一個模型,以得到對應的端到端整合模型;在進行模型訓練時,通過對采用交叉熵損失函數的所述第二模型進行訓練,并以訓練后的所述第二模型的輸出作為所述第一模型的輸入對所述第一模型進行訓練; 將輸入文本輸入至所述端到端整合模型,所述端到端整合模型依次經過所述第二模型、所述第三模型和所述第一模型處理后輸出相應的相似度的過程包括: 通過第二模型獲取與輸入文本對應的實體提及、通過所述第三模型獲取所述實體提及的候選實體以及所述候選實體的實體描述;構建包含所述實體提及與所述實體描述的第一融合序列和包含所述候選實體與所述輸入文本的第二融合序列利用第一模型計算所述實體提及的所述第一融合序列與所述第二融合序列的相似度,并根據所述相似度從所述候選實體中確定出所述實體提及的鏈接實體; 其中,所述第一模型為利用訓練文本的實體提及訓練樣本的正樣本和負樣本通過對比學習的方式對采用對比損失函數的預訓練模型進行訓練得到: 獲取所述訓練文本; 利用第二模型對所述訓練文本進行實體提取得到與所述訓練文本對應的所述實體提及訓練樣本,并通過第三模型確定出與所述實體提及訓練樣本對應的候選實體訓練樣本; 從所述候選實體訓練樣本中確定出正確實體和非正確實體以及相應的實體描述訓練樣本; 將由所述實體提及訓練樣本與正確實體的實體描述訓練樣本組成的序列確定為第一正樣本序列并將由正確實體與所述訓練文本組成的序列確定為第二正樣本序列,以及將由所述實體提及訓練樣本與非正確實體的實體描述訓練樣本組成的序列確定為第一負樣本序列并將由非正確實體與所述訓練文本組成的序列確定為第二負樣本序列; 利用所述第一正樣本序列、所述第二正樣本序列、所述第一負樣本序列和所述第二負樣本序列通過對比學習的方式對采用對比損失函數的預訓練模型進行訓練得到所述第一模型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浪潮電子信息產業股份有限公司,其通訊地址為:250101 山東省濟南市高新區浪潮路1036號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。