北京工業(yè)大學(xué)陳楊獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉北京工業(yè)大學(xué)申請的專利基于知識圖譜的智能搜索系統(tǒng)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN114218472B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-09發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202111540151.2,技術(shù)領(lǐng)域涉及:G06F16/9532;該發(fā)明授權(quán)基于知識圖譜的智能搜索系統(tǒng)是由陳楊;肖創(chuàng)柏設(shè)計研發(fā)完成,并于2021-12-15向國家知識產(chǎn)權(quán)局提交的專利申請。
本基于知識圖譜的智能搜索系統(tǒng)在說明書摘要公布了:本發(fā)明公開了基于知識圖譜的智能搜索系統(tǒng),包括數(shù)據(jù)管理模塊、數(shù)據(jù)處理模塊、自然語言處理服務(wù)模塊、知識圖譜構(gòu)建模塊、信息檢索模塊;數(shù)據(jù)管理模塊、數(shù)據(jù)處理模塊、自然語言處理服務(wù)模塊、知識圖譜構(gòu)建模塊、信息檢索模塊并列連接。基于BERT預(yù)訓(xùn)練模型實現(xiàn)了以下三個NLP服務(wù),包括三元組抽取、命名實體識別、語義匹配。通過基于python的flask框架。研發(fā)出基于特定領(lǐng)域的數(shù)據(jù)構(gòu)建知識圖譜,提出二次訓(xùn)練三元組抽取模型的方法,減少人工標(biāo)注訓(xùn)練數(shù)據(jù)的工作量,實現(xiàn)了針對原始的特定數(shù)據(jù)集進行盡可能少的人工標(biāo)注,并訓(xùn)練出針對此數(shù)據(jù)集的三元組抽取模型;在一定程度上,使得搜索引擎能夠理解用戶的意圖,使企業(yè)級搜索引擎更加智能化。
本發(fā)明授權(quán)基于知識圖譜的智能搜索系統(tǒng)在權(quán)利要求書中公布了:1.基于知識圖譜的智能搜索系統(tǒng),其特征在于:包括數(shù)據(jù)管理模塊、數(shù)據(jù)處理模塊、自然語言處理服務(wù)模塊、知識圖譜構(gòu)建模塊、信息檢索模塊;數(shù)據(jù)管理模塊、數(shù)據(jù)處理模塊、自然語言處理服務(wù)模塊、知識圖譜構(gòu)建模塊、信息檢索模塊并列連接;在自然語言處理模塊,基于BERT預(yù)訓(xùn)練模型實現(xiàn)以下三個NLP服務(wù),包括三元組抽取、命名實體識別、語義匹配;通過基于python的flask框架,以web服務(wù)接口的形式對系統(tǒng)提供服務(wù),并封裝返回結(jié)果,在需要進行自然語言處理的部分對對應(yīng)的接口進行調(diào)用,進行結(jié)果的解析和處理;在此基礎(chǔ)上進行改進,提出語句與關(guān)系詞之間的語義匹配的方式,使得企業(yè)級搜索引擎能夠理解用戶的自然語言搜索請求; nebula-graph數(shù)據(jù)管理負(fù)責(zé)實現(xiàn)圖數(shù)據(jù)庫nebula-graph的space創(chuàng)建和刪除,負(fù)責(zé)管理nebula-graph的space的schema配置信息即創(chuàng)建、刪除標(biāo)簽或點類型,創(chuàng)建、刪除邊類型,創(chuàng)建、刪除tag索引,創(chuàng)建、刪除edge索引; 三元組schema配置管理模塊:三元組是subject,predicate,object亦即頭實體、關(guān)系、尾實體,三元組schema是subject的類型,predicate和object的類型;此模塊用于構(gòu)建知識圖譜;基于bert預(yù)訓(xùn)練語言模型,通過下游任務(wù)對模型的參數(shù)進行對應(yīng)的修改,然后進行三元組抽取人物的訓(xùn)練,訓(xùn)練需要schema配置以及根據(jù)schema配置標(biāo)注的訓(xùn)練數(shù)據(jù);schema配置存儲在待搜索數(shù)據(jù)集所對應(yīng)后綴名為“_schema”的數(shù)據(jù)集,用于對schema進行管理,此模塊作用為添加、修改、刪除schema,根據(jù)schema對待查詢collection的數(shù)據(jù)進行審核并重新標(biāo)注,并將配置寫入到訓(xùn)練數(shù)據(jù)以進行三元組抽取模型的訓(xùn)練; 自然語言處理服務(wù)模塊:用python編寫,實現(xiàn)三元組抽取、命名實體識別、語句與關(guān)系詞之間的語義匹配、兩個語句之間的語義匹配四個功能,并把它們分別封裝成接口,通過flask框架提供web服務(wù)的形式供springboot項目調(diào)用; 三元組抽取:此模塊實現(xiàn)了三元組抽取功能,首先訓(xùn)練三元組抽取模型,訓(xùn)練好的模型保存在服務(wù)器上,并編寫代碼,通過flask框架對外提供web服務(wù),輸入為一個短文本集合ListStringtext,輸出則為輸入的每個短文本對應(yīng)的三元組,包括抽取的文本text,以及text對應(yīng)的三元組信息即subject、subjectType、object、objectType、predicate,返回結(jié)果封裝成json格式; 命名實體識別:此模塊實現(xiàn)命名實體識別功能,首先訓(xùn)練命名實體識別的模型,訓(xùn)練好的模型在服務(wù)器上進行保存,編寫代碼,通過flask框架提供web服務(wù)接口,供springboot項目調(diào)用,輸入為短文本集合,返回的結(jié)果為命名實體,結(jié)果封裝為json格式; 語義匹配:此部分分為語句與關(guān)系詞之間的語義匹配以及兩個語句之間的語義匹配兩個部分,分別訓(xùn)練模型,將訓(xùn)練好的模型保存在服務(wù)器上,編寫代碼,通過flask框架提供web服務(wù),在自然語言搜索的過程中會進行調(diào)用。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人北京工業(yè)大學(xué),其通訊地址為:100124 北京市朝陽區(qū)平樂園100號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 富士施樂株式會社半田修獲國家專利權(quán)
- 新鄉(xiāng)市萬和過濾技術(shù)股份公司牛新伍獲國家專利權(quán)
- 皖南醫(yī)學(xué)院第一附屬醫(yī)院(皖南醫(yī)學(xué)院弋磯山醫(yī)院)丁錦獲國家專利權(quán)
- 蘇州市職業(yè)大學(xué)汪義旺獲國家專利權(quán)
- 三星電子株式會社李泰潤獲國家專利權(quán)
- 深圳市繹立銳光科技開發(fā)有限公司陳彬獲國家專利權(quán)
- 阿里巴巴集團控股有限公司杜稼淳獲國家專利權(quán)
- 廈門宏遠(yuǎn)達電器有限公司吳家森獲國家專利權(quán)
- 高通股份有限公司S·阿卡拉卡蘭獲國家專利權(quán)
- 西安西電捷通無線網(wǎng)絡(luò)通信股份有限公司井經(jīng)濤獲國家專利權(quán)