言圖科技有限公司陳波獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉言圖科技有限公司申請的專利一種知識嵌入的方法、系統、介質、設備及數據處理終端獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114912611B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210094103.3,技術領域涉及:G06N5/022;該發明授權一種知識嵌入的方法、系統、介質、設備及數據處理終端是由陳波;涂婳設計研發完成,并于2022-01-26向國家知識產權局提交的專利申請。
本一種知識嵌入的方法、系統、介質、設備及數據處理終端在說明書摘要公布了:本發明屬于自然語言中的知識嵌入技術領域,公開了一種知識嵌入的方法、系統、介質、設備及數據處理終端,根據所有背景知識庫的詞語構建一棵Trie樹,給定輸入句子,然后通過AC樹算法查找輸入句子中存在的背景知識詞語;將不同緯度詞語轉換為字嵌入向量;生成多維的背景知識嵌入向量;將字嵌入向量與多維的背景知識嵌入向量拼接得到的輸入向量輸入實體識別模型。本發明提供的知識嵌入的方法,通過將不同類型、方式、長度的知識轉為同一向量表示,可以應用到任意神經網絡模型輸入中。本發明在開源命名實體識別數據集MSRA、Resume上分別取得F1值95.03、96.78,知識嵌入給模型的提升在1~2個點,在CoNLL2003、MSRA、OntoNotes4.0數據集上F1值均取得提升。
本發明授權一種知識嵌入的方法、系統、介質、設備及數據處理終端在權利要求書中公布了:1.一種知識嵌入的方法,其特征在于,所述知識嵌入的方法包括:將自然世界中不同類型、方式、長度的知識轉為同一向量表示,為實體識別模型提供背景知識,利用所述實體識別模型識別自然文本中存在的實體; 所述知識嵌入的方法包括以下步驟:步驟一,根據所有背景知識庫的詞語構建一棵Trie樹,給定輸入句子,然后通過AC樹算法查找輸入句子中存在的背景知識詞語; 步驟二,將輸入句子中存在的背景知識詞語按照長度區分緯度,然后將不同緯度詞語轉換為字嵌入向量; 步驟三,引入詞性標簽表示詞語所屬的詞性,生成多維的背景知識嵌入向量; 步驟四,將字嵌入向量與多維的背景知識嵌入向量拼接得到的輸入向量輸入實體識別模型,利用所述實體識別模型識別自然文本中存在的實體,輸入向量包含輸入句子的特征信息與背景知識庫的詞語信息; 所述步驟一利用AC樹算法查找獲得所有屬于背景知識庫包括:對于輸入句子,利用AC樹查找算法獲得所有屬于背景知識庫的詞語;根據詞語長度進行劃分,不同長度的詞語對應不同維度的嵌入向量信息;引入詞性標簽,生成多維背景知識嵌入向量;其中,輸入層的詞性標簽只考慮首字符標簽B和無關標簽O,不包括I標簽。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人言圖科技有限公司,其通訊地址為:430000 湖北省武漢市東湖新技術開發區光谷大道3號激光工程設計總部二期研發樓06幢2層12號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。