騰訊科技(深圳)有限公司趙志勇獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉騰訊科技(深圳)有限公司申請的專利文檔識別方法、裝置、電子設備和計算機可讀存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115131804B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210425659.6,技術領域涉及:G06V30/413;該發明授權文檔識別方法、裝置、電子設備和計算機可讀存儲介質是由趙志勇設計研發完成,并于2022-04-21向國家知識產權局提交的專利申請。
本文檔識別方法、裝置、電子設備和計算機可讀存儲介質在說明書摘要公布了:本發明實施例公開了一種文檔識別方法、裝置、電子設備和計算機可讀存儲介質;本發明實施例在顯示文檔識別頁面后,響應于針對文檔識別頁面中的識別控件的觸發操作,在文檔識別頁面中的待識別文檔圖像中提取出版面結構特征和版面內容特征,然后,根據版面結構特征和版面內容特征,在待識別文檔圖像中檢測出至少一個版面內容區域和版面內容區域的內容類型,在待識別文檔圖像中識別出版面內容區域對應的文本內容,并基于文本內容和內容類型,確定版面內容區域的版面內容,然后,根據版面內容,生成待識別文檔圖像對應的目標文檔,并展示目標文檔,該目標文檔為可編輯文檔;該方案可以提升文檔識別的準確性。
本發明授權文檔識別方法、裝置、電子設備和計算機可讀存儲介質在權利要求書中公布了:1.一種文檔識別方法,其特征在于,包括: 顯示文檔識別頁面,所述文檔識別頁面包括待識別文檔圖像和識別控件; 響應于針對所述識別控件的觸發操作,對所述待識別文檔圖像進行版面矯正,得到矯正后文檔圖像; 對所述矯正后文檔圖像的圖像尺寸進行調整,得到調整后文檔圖像; 采用訓練后版面檢測模型在所述調整后文檔圖像中提取出版面結構特征和版面內容特征,所述訓練后版面檢測模型為將scaled-yolov4中的主干網絡替換為CBNetV2的主干網絡得到; 根據所述版面結構特征,在所述待識別文檔圖像中檢測出至少一個版面結構區域和所述版面結構區域對應的區域類型; 根據所述區域類型,確定所述版面結構區域的版面結構類型; 當所述版面結構類型為分欄結構區域時,基于所述版面內容特征,在所述版面結構區域中識別出至少一個版面內容區域和所述版面內容區域的初始內容類型,其中,所述分欄結構區域為待識別文檔圖像包含的文檔中用于進行內容分欄的區域; 當所述初始內容類型為公式時,獲取所述公式對應的版面內容區域的公式位置信息和公式格式信息,并根據所述公式位置信息和公式格式信息,確定所述公式的公式類型,得到所述版面內容區域的內容類型,所述公式類型包括行內公式和行間公式,所述行內公式為在文本段落中的公式,所述行間公式為在所述文本段落之間的公式; 在所述待識別文檔圖像中識別出所述版面內容區域對應的文本內容,并基于所述文本內容和內容類型,確定所述版面內容區域的版面內容; 根據所述版面內容,生成所述待識別文檔圖像對應的目標文檔,并展示所述目標文檔,所述目標文檔為可編輯文檔。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人騰訊科技(深圳)有限公司,其通訊地址為:518057 廣東省深圳市南山區高新區科技中一路騰訊大廈35層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。