青海大學(xué)李長哲獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉青海大學(xué)申請的專利一種唐卡文化知識圖譜展示系統(tǒng)及其構(gòu)建方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN115687314B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-05發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202211136388.9,技術(shù)領(lǐng)域涉及:G06F16/215;該發(fā)明授權(quán)一種唐卡文化知識圖譜展示系統(tǒng)及其構(gòu)建方法是由李長哲;劉曉靜設(shè)計研發(fā)完成,并于2022-09-19向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種唐卡文化知識圖譜展示系統(tǒng)及其構(gòu)建方法在說明書摘要公布了:本發(fā)明公開了一種唐卡文化知識圖譜展示系統(tǒng)及其構(gòu)建方法,通過唐卡數(shù)據(jù)集的構(gòu)建、唐卡文化命名實(shí)體識別、基于Bs?Spert模型的實(shí)體及實(shí)體間關(guān)系的聯(lián)合抽取及唐卡文化知識圖譜展示系統(tǒng)搭建四個部分完成基于Web端的唐卡文化知識圖譜展示系統(tǒng)的構(gòu)建,實(shí)現(xiàn)了對唐卡自然語言文本的命名實(shí)體識別和關(guān)系抽取可視化查詢功能,緩解當(dāng)前以唐卡文化為主題的門戶網(wǎng)站資源少,數(shù)據(jù)分散、知識淺顯的窘迫困境。系統(tǒng)能夠針對不同受眾人群特點(diǎn)進(jìn)行角色劃分,并授予不同程度權(quán)限,使系統(tǒng)在滿足不同人群的基礎(chǔ)上增加不斷改進(jìn)功能。另外系統(tǒng)操作簡單,界面簡潔而豐滿,適用于年齡偏大或不太擅長利用網(wǎng)絡(luò)的用戶。
本發(fā)明授權(quán)一種唐卡文化知識圖譜展示系統(tǒng)及其構(gòu)建方法在權(quán)利要求書中公布了:1.一種唐卡文化知識圖譜展示系統(tǒng)的構(gòu)建方法,其特征在于,具體包括如下步驟: S1,唐卡知識圖譜數(shù)據(jù)集構(gòu)建:由唐卡文化數(shù)據(jù)集搜集整理以及采用Brat工具對唐卡文化數(shù)據(jù)集進(jìn)行標(biāo)注兩部分工作組成; S1-1,數(shù)據(jù)集獲取:首先,通過與唐卡文化具有強(qiáng)相關(guān)性的佛經(jīng)類網(wǎng)站針對性解析,編寫對應(yīng)網(wǎng)絡(luò)爬蟲,使用網(wǎng)絡(luò)爬蟲爬取數(shù)據(jù)集;然后,采用人工方式獲取數(shù)據(jù)并對補(bǔ)充校正;手工查閱并提取唐卡文化強(qiáng)相關(guān)詞條,通過OCR技術(shù)識別,進(jìn)一步對上述爬取數(shù)據(jù)集補(bǔ)充矯正; S1-2,數(shù)據(jù)整理及清洗:對上述獲取數(shù)據(jù)集存在數(shù)據(jù)噪聲大、缺失、重復(fù)、異常點(diǎn)問題進(jìn)行整理及清洗,對數(shù)據(jù)缺失采用全局常量Unknown進(jìn)行填充;對數(shù)據(jù)異常點(diǎn)直接刪除或賦為全局變量Unknown;對數(shù)據(jù)異常點(diǎn)的直接刪除或者異常離群點(diǎn)賦為全局變量Unknown;對數(shù)據(jù)重復(fù)的剔除冗余;在數(shù)據(jù)整理及清洗時要參考來自O(shè)CR技術(shù)識別到的詞條數(shù)據(jù); S1-3,數(shù)據(jù)集標(biāo)注:采用Brat標(biāo)注工具來實(shí)現(xiàn)數(shù)據(jù)集標(biāo)注,首先,對待提取唐卡文本數(shù)據(jù)生成同名后綴為ann文件,然后在annotation.conf文件中配置初始實(shí)體和實(shí)體關(guān)系以及所在文本的位置信息;并選用BIOES作為實(shí)體的標(biāo)注方式;在獲得上述實(shí)體及實(shí)體關(guān)系的基礎(chǔ)上,按照訓(xùn)練集:測試集=8:2的比例劃分?jǐn)?shù)據(jù)集;在Windows環(huán)境下采用VMware虛擬機(jī)軟件安裝Ubuntu系統(tǒng)環(huán)境,進(jìn)而部署B(yǎng)rat標(biāo)注工具; S2,唐卡文化命名實(shí)體識別:采用Bi-Lstm+CRF模型進(jìn)行唐卡命名實(shí)體識別,在Bi-Lstm模型的基礎(chǔ)上引入條件隨機(jī)場,將Bi-Lstm作為特征提取器,該模型最終的輸出看做條件隨機(jī)場模型的輸入,利用條件隨機(jī)場獲得標(biāo)注序列間狀態(tài)轉(zhuǎn)移規(guī)則;最后使用隨機(jī)梯度下降算法進(jìn)行網(wǎng)絡(luò)的學(xué)習(xí); S3,基于Bs-Spert模型的實(shí)體及實(shí)體間關(guān)系的聯(lián)合抽取: S3-1,Bs-Spert模型構(gòu)建:該模型構(gòu)成主要為Bert預(yù)訓(xùn)練模型模塊、集束搜索模塊、跨度分類模塊、跨度過濾模塊及關(guān)系分類模塊;用Bert預(yù)訓(xùn)練模型作為Bs-Spert模型基礎(chǔ)展開面向唐卡文本實(shí)體和實(shí)體間關(guān)系的聯(lián)合抽取; S3-2,Bs-Spert模型訓(xùn)練:Bs-Spert模型在步驟2唐卡文本數(shù)據(jù)集構(gòu)建的基礎(chǔ)上進(jìn)行訓(xùn)練,Bert預(yù)訓(xùn)練模型采用Bert-Base-Chinese; S3-3,唐卡文本實(shí)體和實(shí)體聯(lián)合抽取任務(wù)實(shí)驗(yàn):首先,測試Bs-Spert模型在不同集束寬度BeamWidth影響下的性能;然后,通過測試不同池化函數(shù)在跨度分類模塊上的Precision、Recall、F1-Score值來選擇池化函數(shù);最后,在前兩步結(jié)果的基礎(chǔ)上,與信息抽取中經(jīng)典模型Bert-CNN以及LSTM-RNN進(jìn)行橫向比較,得出Bs-Spert模型在唐卡文化數(shù)據(jù)集上的實(shí)驗(yàn)性能; S4,唐卡文化知識圖譜展示系統(tǒng)的搭建:首先,將唐卡文化知識圖譜的存儲由唐卡文化實(shí)體導(dǎo)入和唐卡文化實(shí)體間關(guān)系兩個步驟將唐卡文化知識保存進(jìn)Neo4j圖數(shù)據(jù)庫中;然后,由系統(tǒng)需求分析、系統(tǒng)設(shè)計、系統(tǒng)測試三個步驟完成唐卡文化知識圖譜web端展示系統(tǒng)的搭建。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人青海大學(xué),其通訊地址為:810000 青海省西寧市城北區(qū)寧大路251號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。


熱門推薦
- 洛克菲勒大學(xué)米歇爾·努森茲韋格獲國家專利權(quán)
- 深圳市萬至達(dá)電機(jī)制造有限公司翁孟坤獲國家專利權(quán)
- 寧波歐琳整體廚房有限公司徐劍光獲國家專利權(quán)
- 法雷奧汽車內(nèi)部控制(深圳)有限公司賀川獲國家專利權(quán)
- 先歌國際影音有限公司張?zhí)浍@國家專利權(quán)
- 青島海爾電冰箱有限公司姚紅雷獲國家專利權(quán)
- 江西晶超光學(xué)有限公司謝晗獲國家專利權(quán)
- 三星電子株式會社麥克·史帝芬·羅德爾獲國家專利權(quán)
- 華為技術(shù)有限公司周天然獲國家專利權(quán)
- 黑拉有限責(zé)任兩合公司P·M·約翰遜獲國家專利權(quán)