上海交通大學陳凱獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉上海交通大學申請的專利基于結(jié)構單元的表格識別方法、系統(tǒng)、終端及介質(zhì)獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN114529773B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-09-23發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202011188084.8,技術領域涉及:G06V10/774;該發(fā)明授權基于結(jié)構單元的表格識別方法、系統(tǒng)、終端及介質(zhì)是由陳凱;徐奕設計研發(fā)完成,并于2020-10-30向國家知識產(chǎn)權局提交的專利申請。
本基于結(jié)構單元的表格識別方法、系統(tǒng)、終端及介質(zhì)在說明書摘要公布了:本發(fā)明提供了一種基于結(jié)構單元的表格識別方法及系統(tǒng),包括:對文檔中表格的結(jié)構單元進行識別;基于獲取的所述結(jié)構單元,對表格進行表格空間結(jié)構確定;對文檔進行文字檢測與識別,并將識別得到的所述文字內(nèi)容填放到確定的所述表格空間結(jié)構中對應的所述結(jié)構單元中,對表格進行重建,完成表格識別。本發(fā)明同時提供了一種相應的終端及存儲介質(zhì)。本發(fā)明提供的基于結(jié)構單元的表格識別方法、系統(tǒng)、終端及介質(zhì),利用表格中的結(jié)構單元有明顯的局部空間特征和局部語義特征的特點,直接識別文檔中表格的結(jié)構單元,無需檢測表格線或者表格分隔行列,處理過程簡單、準確和高效,同時適用于具有完全表格線和非完全表格線等多種類型的表格情況。
本發(fā)明授權基于結(jié)構單元的表格識別方法、系統(tǒng)、終端及介質(zhì)在權利要求書中公布了:1.一種基于結(jié)構單元的表格識別方法,其特征在于,包括: 利用預訓練的表格結(jié)構單元檢測模型直接對文檔中表格的結(jié)構單元進行識別;其中,所述文檔中的表格包括:完全表格線表格和非完全表格線表格,其中,所述非完全表格線表格包括部分表格線表格和無表格線表格;當識別到的表格為完全表格線表格時,所述結(jié)構單元為完全表格線表格中的矩形線框單元;當識別到的表格為非完全表格線表格時,所述結(jié)構單元為非完全表格線表格中按語義理解的表格最小單元;在所述表格結(jié)構單元檢測模型的預訓練過程中,包括如下任意一項或任意多項:在所述表格結(jié)構單元檢測模型中添加整張表格的全局圖像特征;在所述表格結(jié)構單元檢測模型中基于圖像特征進行行池化和列池化;采用軟化的非最大抑制方法或基于混合高斯模型和檢測目標合并方法,對所述表格結(jié)構單元檢測模型進行目標候選框處理; 基于獲取的所述結(jié)構單元,進行表格空間結(jié)構確定; 對文檔進行文字檢測與識別,并將識別得到的文字內(nèi)容填放到確定的表格空間結(jié)構中對應的結(jié)構單元中,對表格進行重建,完成表格識別。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或?qū)@麢嗳?a target="_blank" rel="noopener noreferrer nofollow" href="https://iptop.www.hzsmkbearing.com.cn/list?keyword=%E4%B8%8A%E6%B5%B7%E4%BA%A4%E9%80%9A%E5%A4%A7%E5%AD%A6&temp=1">上海交通大學,其通訊地址為:200240 上海市閔行區(qū)東川路800號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。