湖南視覺偉業智能科技有限公司夏東獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉湖南視覺偉業智能科技有限公司申請的專利融合實體類型的BERT知識圖譜補全方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116010622B 。
龍圖騰網通過國家知識產權局官網在2025-09-05發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310047134.8,技術領域涉及:G06F16/36;該發明授權融合實體類型的BERT知識圖譜補全方法及系統是由夏東設計研發完成,并于2023-01-31向國家知識產權局提交的專利申請。
本融合實體類型的BERT知識圖譜補全方法及系統在說明書摘要公布了:本發明公開了融合實體類型的BERT知識圖譜補全方法及系統,將實體信息的外部知識即實體類型作為實體信息的補充,更好地獲取實體的語義信息,提高模型輸入端的文本增強表示,使用多頭注意力機制的Transformer編碼器實現特征獲取和序列編碼,使用少量的標注三元組進行微調,有效實現隱含關系的挖掘,實現快速、準確的對多源異構數據進行清洗。
本發明授權融合實體類型的BERT知識圖譜補全方法及系統在權利要求書中公布了:1.一種融合實體類型的BERT知識圖譜補全方法,其特征在于,包括以下步驟: 構建BERT知識圖譜補全模型:所述BERT知識圖譜補全模型包括輸入層、編碼層和輸出層,所述輸入層用于構建輸入文本的頭實體、頭實體類型、關系、尾實體和尾實體類型的表示序列;并將所述頭實體、頭實體類型、關系、尾實體和尾實體類型的表示序列拼接成輸入序列;所述編碼層用于對輸入序列進行編碼,并提取編碼后的輸入序列不同層次的語義特征,并對不同層次的語義特征進行拼接;所述輸出層用于計算拼接后的語義特征的預測概率,并計算模型預測概率與預期概率的距離來調整BERT知識圖譜補全模型的網絡參數; 訓練所述BERT知識圖譜補全模型,并使用訓練好的BERT知識圖譜補全模型對輸入文本進行分類預測; 所述編碼層采用雙向Tansformer編碼器對輸入序列進行編碼,并采用多頭注意力機制提取編碼后的輸入序列不同層次的語義特征,并對不同層次的語義特征進行拼接;所述輸出層采用sigmod函數計算拼接后的語義特征的預測概率,并計算模型預測概率與預期概率的距離,判斷所述距離是否超過預設閾值,若距離超過閾值,則調整補全模型的網絡參數;所述輸出層使用[CLS]的最終隱藏狀態作為輸入序列的深層表示和模型的輸出; 所述編碼層包括多頭注意力層、第一殘差歸一化層、前饋網絡層、第二殘差歸一化層; 所述多頭注意力層用于將輸入向量進行注意力計算,得到注意力序列bi; 所述第一殘差歸一化層用于將所述輸入向量與注意力序列bi進行相加得到b′i,并對b′i做層歸一化處理; 所述前饋網絡層使用線性修正單元對層歸一化處理后的b′i進行線性變換; 所述第二殘差歸一化層用于對線性變換后的b′i做層歸一化處理,并將層歸一化處理后的b′i映射為一個表示序列; 訓練所述BERT知識圖譜補全模型,包括: 預訓練階段:使用大量無標注數據對BERT知識圖譜補全模型進行預訓練,在預訓練階段采用遮蔽詞預訓練和預測下一個句子的方法進行結合,得到預訓練初始參數; 微調階段:在不改變BERT內部結構的基礎上,在編碼層后面添加一個輸出層,少量標注三元組參與BERT知識圖譜補全模型的網絡參數調整;最后,由[CLS]特殊標記的編碼結果作為模型的輸出。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人湖南視覺偉業智能科技有限公司,其通訊地址為:410000 湖南省長沙市高新開發區麓天路28號金瑞麓谷科技園C11棟202;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。