國網江蘇省電力有限公司南通供電分公司;國網江蘇省電力有限公司雙創中心;國網江蘇省電力有限公司徐曉軼獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉國網江蘇省電力有限公司南通供電分公司;國網江蘇省電力有限公司雙創中心;國網江蘇省電力有限公司申請的專利一種電力科研信息語義識別方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120449894B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510962082.6,技術領域涉及:G06F40/30;該發明授權一種電力科研信息語義識別方法及系統是由徐曉軼;呂曉祥;毛艷芳設計研發完成,并于2025-07-14向國家知識產權局提交的專利申請。
本一種電力科研信息語義識別方法及系統在說明書摘要公布了:本發明公開了一種電力科研信息語義識別方法及系統,涉及語義識別技術領域,包括:建立電力科研文獻數據庫,并進行多層次文本識別,基于多層次文本識別結果構建領域詞向量,并配置領域詞向量間的文本語義關聯;在獲取目標識別語段后,對目標識別語段進行最小分割粒度下的搜索聚類,建立搜索聚類結果;基于搜索聚類結果執行領域詞向量的相似匹配,建立相似匹配結果;將相似匹配結果返回至目標識別語段,執行文本語義關聯下的聚類信任驗證,根據聚類信任驗證結果生成語義識別結果。本發明解決現有技術中電力科研信息語義理解依賴規則模板、無法適應復雜語義變體的技術問題,達到提升語義識別準確性與跨語段語義匹配能力的技術效果。
本發明授權一種電力科研信息語義識別方法及系統在權利要求書中公布了:1.一種電力科研信息語義識別方法,其特征在于,所述方法包括: 在通過接口抓取電力科研文獻后,建立電力科研文獻數據庫,所述電力科研文獻數據庫內的數據包括文本數據、圖表數據、實驗數據; 對所述電力科研文獻數據庫進行多層次文本識別,基于多層次文本識別結果構建領域詞向量,并配置領域詞向量間的文本語義關聯; 在獲取目標識別語段后,對所述目標識別語段進行最小分割粒度下的搜索聚類,建立搜索聚類結果; 基于所述搜索聚類結果執行領域詞向量的相似匹配,建立相似匹配結果; 將所述相似匹配結果返回至目標識別語段,執行文本語義關聯下的聚類信任驗證,根據聚類信任驗證結果生成語義識別結果; 其中,對所述電力科研文獻數據庫進行多層次文本識別,包括: 讀取電力科研文獻數據庫內文獻的文獻結構,根據所述文獻結構進行段落標識; 基于命名實體識別和關鍵詞抽取執行電力科研文獻數據庫內文獻的領域詞匯提?。?根據領域詞匯提取結果和領域詞匯定位進行基于段落標識下的自注意力多層次語義分析,建立多層次文本識別結果; 其中,根據領域詞匯提取結果和領域詞匯定位進行基于段落標識下的自注意力多層次語義分析,建立多層次文本識別結果,包括: 根據所述領域詞匯定位、所述段落標識提取領域詞匯上下文,并根據段落標識配置領域詞匯上下文的局部-全局分析權重; 配置標定多層次搜索空間,利用所述標定多層次搜索空間進行領域詞匯上下文的自適應層次空間配置后,利用局部-全局分析權重執行多層次注意力語義分析,以建立多層次文本識別結果; 其中,基于所述搜索聚類結果執行領域詞向量的相似匹配,建立相似匹配結果,包括: 對跨領域文獻進行數據提取后,建立跨領域數據庫; 在執行領域詞向量的相似匹配過程中,判斷相似匹配結果是否不能滿足預設匹配閾值; 若相似匹配結果不能滿足預設匹配閾值,則激活所述跨領域數據庫,執行附加相似匹配; 根據附加相似匹配結果更新所述相似匹配結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人國網江蘇省電力有限公司南通供電分公司;國網江蘇省電力有限公司雙創中心;國網江蘇省電力有限公司,其通訊地址為:226006 江蘇省南通市崇川區青年中路52號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。