廣東電網有限責任公司;廣東電網有限責任公司中山供電局古俊賢獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉廣東電網有限責任公司;廣東電網有限責任公司中山供電局申請的專利文檔信息處理方法及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119202128B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411213618.6,技術領域涉及:G06F16/3332;該發明授權文檔信息處理方法及存儲介質是由古俊賢設計研發完成,并于2024-08-30向國家知識產權局提交的專利申請。
本文檔信息處理方法及存儲介質在說明書摘要公布了:本發明公開了一種文檔信息處理方法及存儲介質,涉及數據處理技術領域。其中,該方法包括:獲取待處理文檔和基準文檔;對待處理文檔進行預處理,得到第一處理結果,以及對基準文檔進行預處理,得到第二處理結果;基于第一處理結果對第一關鍵詞進行信息衍生,得到待比較信息合集,以及基于第二處理結果對第二關鍵詞進行信息衍生,得到基準信息合集;對待比較信息合集與基準信息合集進行差異比較,得到目標信息合集,其中,目標信息合集用于表征待比較信息合集與基準信息合集的差異狀況。本發明解決了現有技術對文檔信息處理精度差、依賴人工智能大模型進行信息衍生導致成本高的技術問題。
本發明授權文檔信息處理方法及存儲介質在權利要求書中公布了:1.一種文檔信息處理方法,其特征在于,包括: 獲取待處理文檔和基準文檔; 對所述待處理文檔進行分析處理,得到分塊信息; 將所述分塊信息中任意一個關鍵詞與任意一個需求關鍵詞進行匹配,得到匹配結果,其中,所述匹配結果包括第一關鍵詞以及第一位置信息,所述第一關鍵詞為所述待處理文檔中的待衍生關鍵詞; 基于所述匹配結果對所述分塊信息進行結構劃分,得到第一處理結果,所述第一處理結果包括位置關鍵詞對應的衍生結點、前文信息和后文信息,具體包括:按照所述第一位置信息讀取當前分塊信息對應的所有關鍵詞位置,判斷所述當前分塊信息是否存在所述第一關鍵詞;當不存在所述第一關鍵詞時,將所述當前分塊信息并入前一個分塊信息的最后一個第一關鍵詞對應的后文信息中;當存在所述第一關鍵詞時,先對所述當前分塊信息中的每個第一關鍵詞進行預處理,從所述當前分塊信息中去除已經進行預處理的第一關鍵詞相關的文檔信息,并對所述當前分塊信息的剩余文檔信息進行關鍵詞存在性判斷,當進一步確定所述剩余文檔信息中不存在所述第一關鍵詞時,對已經完成預處理的第一關鍵詞進行后文信息設定; 以及對所述基準文檔進行預處理,得到第二處理結果,其中,所述第二處理結果至少用于確定第二關鍵詞,所述第二關鍵詞為所述基準文檔中的待衍生關鍵詞; 基于所述第一處理結果對所述第一關鍵詞進行信息衍生,得到待比較信息合集,以及基于所述第二處理結果對所述第二關鍵詞進行信息衍生,得到基準信息合集; 對所述待比較信息合集與所述基準信息合集進行差異比較,得到目標信息合集,其中,所述目標信息合集用于表征所述待比較信息合集與所述基準信息合集的差異狀況; 其中,基于所述第一處理結果對所述第一關鍵詞進行信息衍生,得到所述待比較信息合集包括:將所述第一位置信息中的當前關鍵詞位置作為當前衍生位置;將所述當前衍生位置對應的位置關鍵詞作為當前衍生關鍵詞;從所述第一處理結果中提取所述位置關鍵詞對應的衍生結點作為當前衍生結點;計算位于所述當前衍生結點至當前衍生位置之間的單位文檔信息的數量,得到計算結果;將所述計算結果與預設數值進行比較,得到第一比較結果,其中,所述第一比較結果用于確定是否對所述當前衍生關鍵詞進行循環衍生;響應根據所述第一比較結果確定所述計算結果小于所述預設數值,判斷所述當前衍生關鍵詞是否存在于預設需求詞庫中,得到第一判斷結果;響應根據所述第一判斷結果確定所述當前衍生關鍵詞未存在于所述預設需求詞庫中,根據所述當前衍生關鍵詞和所述當前衍生位置生成衍生結果;根據所述衍生結果和所述當前衍生關鍵詞對應的后文信息生成所述待比較信息合集。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廣東電網有限責任公司;廣東電網有限責任公司中山供電局,其通訊地址為:510600 廣東省廣州市越秀區東風東路757號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。