蘇州研途教育科技有限公司康立獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉蘇州研途教育科技有限公司申請的專利一種基于微調(diào)大語言模型的知識圖譜構(gòu)建方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN119808917B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-02發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202411934774.1,技術(shù)領(lǐng)域涉及:G06N5/022;該發(fā)明授權(quán)一種基于微調(diào)大語言模型的知識圖譜構(gòu)建方法是由康立;宣鵬;孟醒;張宇輝設(shè)計研發(fā)完成,并于2024-12-26向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種基于微調(diào)大語言模型的知識圖譜構(gòu)建方法在說明書摘要公布了:本發(fā)明公開了一種基于微調(diào)大語言模型的知識圖譜構(gòu)建方法,如下步驟:S1):數(shù)據(jù)預(yù)處理,S2):對數(shù)據(jù)源中的知識點和關(guān)系進行提取,獲得預(yù)處理知識點和關(guān)系;S3):知識點和關(guān)系消岐;S4):知識圖譜構(gòu)建,形成動態(tài)可擴展的知識圖譜,后期使用過程中定期使用AI模型重新分析文本資料,更新知識圖譜。本發(fā)明通過利用知識點提取微調(diào)模型自動提取知識點確定實體和關(guān)系邊,通過多種消岐手段對知識點進一步的識別并構(gòu)建知識點之間的復(fù)雜關(guān)系,對有效提高數(shù)據(jù)處理的提高效率和準(zhǔn)確性,最后將消岐處理后的數(shù)據(jù)存儲到圖數(shù)據(jù)庫模型中構(gòu)建知識圖譜,實現(xiàn)知識圖譜的自動化構(gòu)建和更新。
本發(fā)明授權(quán)一種基于微調(diào)大語言模型的知識圖譜構(gòu)建方法在權(quán)利要求書中公布了:1.一種基于微調(diào)大語言模型的知識圖譜構(gòu)建方法,其特征在于:包括:如下步驟: S1:數(shù)據(jù)預(yù)處理,即對待提取知識點的數(shù)據(jù)源進行處理,所述待提取知識點的數(shù)據(jù)源包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)直接輸入到映射器,對非結(jié)構(gòu)化數(shù)據(jù)中的文本資料進行數(shù)據(jù)清洗; S2:對數(shù)據(jù)源中的知識點和關(guān)系進行提取,先構(gòu)建專屬的知識點提取微調(diào)模型,將經(jīng)過數(shù)據(jù)預(yù)處理后的數(shù)據(jù)輸入知識點提取微調(diào)模型中,通過知識點提取微調(diào)模型自動識別文本中的實體,并提取出實體之間的關(guān)系,獲得預(yù)處理知識點和關(guān)系; S3:知識點和關(guān)系消岐,即對同一個知識點不同描述的識別與映射;具體消岐處理流程如下: S31:建立標(biāo)準(zhǔn)知識點庫,即首先進行知識點實體標(biāo)準(zhǔn)集構(gòu)建,建立的知識點實體標(biāo)準(zhǔn)集作為映射的目標(biāo)集合,用于對文本中提取出的知識點進行消岐; S32:相似度計算與映射,即采用自然語言處理中的文本嵌入技術(shù)將知識點及相關(guān)文本轉(zhuǎn)化為向量;再進行相似度計算,通過計算文本嵌入向量之間的余弦相似度或歐式距離,來判斷提取出來的不同表述是否指向同一個知識點; S33:基于上下文進行語義消岐:使用滑動窗口技術(shù)將上下文信息納入考慮范圍,從預(yù)處理知識點中提取出知識點關(guān)系; S34:迭代驗證與反饋優(yōu)化:在消岐后,上一步中提取出來的知識點及關(guān)系會被映射到知識點實體標(biāo)準(zhǔn)集中,對兩者進行匹配,尋找可能的對應(yīng)關(guān)系,通過提取出的關(guān)系進行進一步驗證,若不匹配則刪除該實體; S4:知識圖譜構(gòu)建:先建立圖數(shù)據(jù)庫模型,創(chuàng)建新實體節(jié)點,并創(chuàng)建實體節(jié)點之間的關(guān)系形成關(guān)系邊,再將消岐后的實體節(jié)點和關(guān)系邊存儲到圖數(shù)據(jù)庫模型,形成動態(tài)可擴展的知識圖譜,后期使用過程中定期使用AI模型重新分析文本資料,更新知識圖譜; 在消岐過程中,結(jié)合符號推理: 1:知識點提取:從文獻中提取原始數(shù)據(jù)中潛在的相似知識點,并通過深度學(xué)習(xí)模型獲取初步的語義相似度; 2:語義消歧:使用深度學(xué)習(xí)方法進行初步的相似度計算,相似度低于目標(biāo)值的將會被刪除,消歧一些基礎(chǔ)的知識點; 3:符號推理規(guī)則應(yīng)用:對未能消歧或相似度不足的知識點,結(jié)合符號推理,通過定義的規(guī)則集或邏輯推理,基于領(lǐng)域中的已知知識進一步校正結(jié)果; 4:推理優(yōu)化:上一步中符號推理的結(jié)果反饋至深度學(xué)習(xí)模型,用于進一步調(diào)整深度學(xué)習(xí)模型的權(quán)重或閾值; 5:輸出最終結(jié)果:結(jié)合符號推理和深度學(xué)習(xí)消歧的最終結(jié)果,判斷兩個知識點是否相同。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人蘇州研途教育科技有限公司,其通訊地址為:215000 江蘇省蘇州市工業(yè)園區(qū)星湖街328號創(chuàng)意產(chǎn)業(yè)園6幢202單元;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 富通麥迪資產(chǎn)二有限公司馬修斯·亨德里克·路易斯·西森獲國家專利權(quán)
- 中國瑞林工程技術(shù)股份有限公司毛志琨獲國家專利權(quán)
- AGC株式會社村山優(yōu)獲國家專利權(quán)
- 中國核電工程有限公司劉國彪獲國家專利權(quán)
- 湖北銳世數(shù)字醫(yī)學(xué)影像科技有限公司劉世豪獲國家專利權(quán)
- 華為技術(shù)有限公司于健獲國家專利權(quán)
- 愛德華茲生命科學(xué)公司D·S·帕特爾獲國家專利權(quán)
- 三星電子株式會社郭瑩宇獲國家專利權(quán)
- 高通股份有限公司陳萬士獲國家專利權(quán)
- 麥克賽爾株式會社平冢幸惠獲國家專利權(quán)