行至智能(北京)技術有限公司周曉琴獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉行至智能(北京)技術有限公司申請的專利一種基于大模型全自動的知識圖譜構建方法、系統、電子設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN118278508B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202410209268.X,技術領域涉及:G06N5/022;該發明授權一種基于大模型全自動的知識圖譜構建方法、系統、電子設備及存儲介質是由周曉琴設計研發完成,并于2024-02-26向國家知識產權局提交的專利申請。
本一種基于大模型全自動的知識圖譜構建方法、系統、電子設備及存儲介質在說明書摘要公布了:本發明公開了一種基于大模型全自動的知識圖譜構建方法、系統、電子設備及存儲介質,包括基于業務類型獲取對應的數據樣本;對數據樣本進行預處理;將預處理數據樣本輸入至大型語言模型,識別實體信息,實體信息包括實體類型、關系類型和屬性類型;基于實體信息,構建知識圖譜;基于大模型通過自然語言自動召回圖譜知識;本發明利用大型語言模型,從文本數據中推理實體信息,構建高度智能化的知識圖譜,并通過大語言模型自動召回圖譜知識。
本發明授權一種基于大模型全自動的知識圖譜構建方法、系統、電子設備及存儲介質在權利要求書中公布了:1.一種基于大模型全自動的知識圖譜構建方法,其特征在于,包括: 基于業務類型獲取對應的數據樣本; 對所述數據樣本進行預處理; 將預處理所述數據樣本輸入至大型語言模型,識別實體信息,所述實體信息包括實體、實體關系和實體屬性; 基于所述實體信息,構建知識圖譜; 基于所述大型語言模型自動召回所述知識圖譜; 其中,所述大型語言模型基于所述業務類型進行選擇;所述實體包括名詞,利用模型對識別到的實體進行推理,確定其具體類型;所述實體關系包括所述實體之間所屬關系詞語,使用模型的語義理解能力進行關系抽取,通過訓練數據學習實體對之間的關系,利用上下文信息和關鍵詞來推理關系的具體類型;所述實體屬性包括描述所述實體特征或狀態的詞語,模型深入分析文本,了解實體的語義信息,提取屬性并理解屬性的上下文含義,利用上下文語境和常見模式來推理屬性的具體類型; 利用生成的圖譜schema中的實體、屬性及關系信息,結合大模型的語言理解能力,從相應的數據源中抽取實體的具體實例、屬性值、實體間的關系;通過提示prompt工程,設計合適的自然語言描述,使大模型理解需要抽取的實體、屬性及關系的上下文,并生成對應的三元組;利用生成的圖譜,通過大模型進行語義推理,以發現實體和關系之間的潛在關聯;利用大模型的語境理解能力,推斷實體之間的邏輯關聯,生成更全面的三元組信息,基于實體、關系和屬性信息的抽取結果,自動生成知識圖譜實例; 獲取所述實體信息,合并相似的所述實體信息以及去除出現概率低于閾值的所述實體; 所述數據樣本包括結構化數據和非結構化數據; 對所述數據樣本進行預處理包括: 去除所述數據樣本中包含HTML標簽和特殊格式的內容以及去除重復內容; 對所述數據樣本進行標準化處理; 數據庫根據查詢語句從圖譜中召回相關數據,包括實體、關系和屬性信息;圖譜數據溯源,對召回的數據提供原文信息溯源。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人行至智能(北京)技術有限公司,其通訊地址為:100080 北京市海淀區紫金數碼園3號樓9層907;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。