北京工業大學王文珂獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京工業大學申請的專利一種基于語義增強的多特征融合的實體關系聯合抽取方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115934883B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310010231.X,技術領域涉及:G06F16/31;該發明授權一種基于語義增強的多特征融合的實體關系聯合抽取方法是由王文珂;王潔設計研發完成,并于2023-01-04向國家知識產權局提交的專利申請。
本一種基于語義增強的多特征融合的實體關系聯合抽取方法在說明書摘要公布了:本發明公開了一種基于語義增強的多特征融合的實體關系聯合抽取方法,通過將實體關系聯合抽取任務視為以關系作為條件通過主體映射客體的函數,采用先進行頭實體識別,再在每一種關系下識別尾實體的抽取思路。采用先進行頭實體信息識別,將經過RNN編碼后的增強了序列依賴信息的特征利用指針網絡識別頭實體的開始和結束位置,并將頭實體及其實體類型作為先驗信息,將多特征與增強特征進行融合,獲取增強語義表達能力的融合向量,減少模型對語義不相關實體的關注。本方法采用了注意力機制以使句子中的詞更容易捕獲到加入了頭實體信息的全局特征,強化特征依賴,提高在復雜的重疊場景下抽取關系三元組性能。
本發明授權一種基于語義增強的多特征融合的實體關系聯合抽取方法在權利要求書中公布了:1.一種基于語義增強的多特征融合的實體關系聯合抽取方法,其特征在于,包括如下步驟: 步驟1:數據編碼;將待進行實體關系抽取任務的數據輸入到預訓練模型中得到數據的句子共享編碼向量矩陣和實體類型向量表示; 步驟2:上下文信息強化;將步驟1得到的共享編碼向量矩陣輸入到上下文信息強化模塊,采用雙向長短時記憶網絡BiLSTM通過門控機制實現對輸入數據中關鍵特征的保留和傳遞,實現對句子向量進行深層次特征提取,以學習到觀測序列上的依賴關系,提高頭實體識別準確性; 步驟3:頭實體信息識別;將步驟2經過上下文信息強化的增強向量輸入到頭實體信息識別模塊用于識別出句子中所有的頭實體及其實體類型; 步驟4:多特征融合;將頭實體相關信息和共享編碼向量進行融合,以得到用于標記尾實體和關系的融合特征; 步驟5:尾實體和關系的識別;將步驟4構建的融合向量進行尾實體和關系的識別,采用多層二元分類器,層數為預定義的關系種類個數,以實現在識別出頭實體的基礎上,識別每個關系下所有可能的尾實體; 步驟3中,通過將步驟2的增強向量輸入到兩個相同的獨立二元分類器01中進行解碼,計算得到每個token作為開始和結束位置的概率,然后判斷概率值是否大于預設的閾值來決定是否為實體邊界;若大于閾值則標記為1,是實體邊界;否則標記為0,不是實體邊界;在獲得實體邊界之后,將共享編碼向量根據二元分類器標記為1的起始位置進行截取,以獲得當前頭實體的向量表示;然后將頭實體向量輸入到實體類型sigmoid分類器中進行類型識別操作,以得到對應實體的實體類型; 步驟4中,首先根據步驟3得到的實體類型從步驟1中選取對應的實體類型向量和步驟3中截取出的頭實體向量計算平均編碼表示,再進行拼接融合;為句中的單詞賦予不同的注意力權重,通過使用注意力機制,使句子中的詞更容易捕獲到加入了頭實體信息的全局特征,強化特征依賴。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京工業大學,其通訊地址為:100124 北京市朝陽區平樂園100號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。