南昌航空大學肖安毅獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南昌航空大學申請的專利一種輕量級表格結構識別方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119919952B 。
龍圖騰網通過國家知識產權局官網在2025-09-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510409433.0,技術領域涉及:G06T3/02;該發明授權一種輕量級表格結構識別方法是由肖安毅;楊詞慧;楊德生;袁鳳連;何肖楠設計研發完成,并于2025-04-02向國家知識產權局提交的專利申請。
本一種輕量級表格結構識別方法在說明書摘要公布了:本發明公開了一種輕量級表格結構識別方法,步驟如下:收集公開的表格圖像及相應的標注數據并進行初步處理,得到第一表格結構識別數據集;對第一表格結構識別數據集進行預處理,得到第二表格結構識別數據集;將第二表格結構識別數據集劃分為訓練集、驗證集和測試集;對表格結構識別模型的結構進行設計,并對表格結構識別模型的參數進行初始化,得到第一表格結構識別模型;使用第二表格結構識別數據集對第一表格結構識別模型進行訓練,得到第二表格結構識別模型;將待測圖像輸入第二表格結構識別模型進行推理并解碼,得到表格結構的識別結果。本發明的優勢在于,在確保檢測精度的基礎上,完成表格結構識別模型的輕量化構建,提升模型推理速度。
本發明授權一種輕量級表格結構識別方法在權利要求書中公布了:1.一種輕量級表格結構識別方法,其特征在于:主要包括以下步驟: 步驟S1;獲取表格結構識別數據集:收集公開的表格圖像及相應的標注數據,并對標注數據中表示表格結構的單元格物理坐標和邏輯坐標進行提取,得到第一表格結構識別數據集T1; 步驟S2;預處理表格結構識別數據集:對第一表格結構識別數據集T1進行數據增強和標準化,得到第二表格結構識別數據集T2;將第二表格結構識別數據集T2劃分為訓練集datat、驗證集datav和測試集datae; 步驟S3;構建表格結構識別模型:對表格結構識別模型的基礎架構進行設計,并依據表格結構識別模型的基礎架構將五個下采樣模塊、一個激活函數ReLU6、十六個表格特征提取模塊、九個表格特征融合模塊和六個預測頭按照序列連接,得到未初始化的表格結構識別模型Mr;對未初始化的表格結構識別模型Mr的參數進行初始化,得到第一表格結構識別模型M; 步驟S4;訓練表格結構識別模型:使用第二表格結構識別數據集T2對第一表格結構識別模型M進行訓練,得到第二表格結構識別模型Mt; 步驟S5;識別表格結構:從測試集datae中隨機選擇表格圖像輸入第二表格結構識別模型Mt中進行推理,得到六種表示表格結構的特征圖;將六種表示表格結構的特征圖進行解碼,得到包含單元格物理坐標和邏輯坐標的表格結構識別結果; 步驟S3中,對表格結構識別模型的基礎架構進行設計,并依據表格結構識別模型的基礎架構將五個下采樣模塊、一個激活函數ReLU6、十六個表格特征提取模塊、九個表格特征融合模塊和六個預測頭按照序列連接,得到未初始化的表格結構識別模型Mr,具體步驟如下: 步驟S311,第一下采樣模塊接收經過預處理的第二表格圖像Ip,第一下采樣模塊的輸出連接第一激活函數ReLU6的輸入;第一激活函數ReLU6的輸出連接第二下采樣模塊的輸入,第二下采樣模塊的輸出連接第一表格特征提取模塊的輸入,第一表格特征提取模塊的輸出連接第二表格特征提取模塊的輸入;第二表格特征提取模塊的輸出連接第三下采樣模塊的輸入,第三下采樣模塊的輸出連接第三表格特征提取模塊的輸入,第三表格特征提取模塊的輸出連接第四表格特征提取模塊的輸入;第四表格特征提取模塊的輸出連接第四下采樣模塊的輸入,第四下采樣模塊的輸出連接第五表格特征提取模塊的輸入,第五表格特征提取模塊的輸出連接第六表格特征提取模塊的輸入,第六表格特征提取模塊的輸出連接第七表格特征提取模塊的輸入,第七表格特征提取模塊的輸出連接第八表格特征提取模塊的輸入,第八表格特征提取模塊的輸出連接第九表格特征提取模塊的輸入,第九表格特征提取模塊的輸出連接第十表格特征提取模塊的輸入,第十表格特征提取模塊的輸出連接第十一表格特征提取模塊的輸入,第十一表格特征提取模塊的輸出連接第十二表格特征提取模塊的輸入;第十二表格特征提取模塊的輸出連接第五下采樣模塊的輸入,第五下采樣模塊的輸出連接第十三表格特征提取模塊的輸入,第十三表格特征提取模塊的輸出連接第十四表格特征提取模塊的輸入,第十四表格特征提取模塊的輸出連接第十五表格特征提取模塊的輸入,第十五表格特征提取模塊的輸出連接第十六表格特征提取模塊的輸入; 步驟S312,第十二表格特征提取模塊的輸出連接第一表格特征融合模塊的第一輸入和第十六表格特征提取模塊的輸出連接第一表格特征融合模塊的第二輸入;第四表格特征提取模塊的輸出連接第二表格特征融合模塊的第一輸入和第十二表格特征提取模塊的輸出連接第二表格特征融合模塊的第二輸入,第二表格特征融合模塊的輸出連接第三表格特征融合模塊的第一輸入和第一表格特征融合模塊的輸出連接第三表格特征融合模塊的第二輸入;第二表格特征提取模塊的輸出連接第四表格特征融合模塊的第一輸入和第四表格特征提取模塊的輸出連接第四表格特征融合模塊的第二輸入,第四表格特征融合模塊的輸出連接第五表格特征融合模塊的第一輸入和第二表格特征融合模塊的輸出連接第五表格特征融合模塊的第二輸入,第五表格特征融合模塊的輸出連接第六表格特征融合模塊的第一輸入和第三表格特征融合模塊的輸出連接第六表格特征融合模塊的第二輸入;第三表格特征融合模塊的輸出連接第七表格特征融合模塊的第一輸入和第一表格特征融合模塊的輸出連接第七表格特征融合模塊的第二輸入;第六表格特征融合模塊的輸出連接第八表格特征融合模塊的第一輸入和第三表格特征融合模塊的輸出連接第八表格特征融合模塊的第二輸入,第八表格特征融合模塊的輸出連接第九表格特征融合模塊的第一輸入和第七表格特征融合模塊的輸出連接第九表格特征融合模塊的第二輸入; 步驟S313,第九表格特征融合模塊的輸出同時連接第一預測頭、第二預測頭、第三預測頭、第四預測頭、第五預測頭和第六預測頭,得到未初始化的表格結構識別模型Mr; 步驟S3中,十六個表格特征提取模塊中的任一表格特征提取模塊包括三個卷積層、二個深度可分離卷積層、一個激活函數ReLU6和二個批歸一化層;具體為: 表格特征提取模塊的輸入連接第一深度可分離卷積層的輸入,第一深度可分離卷積層的輸出連接第二批歸一化層的輸入,第二批歸一化層的輸出同時連接第二卷積層的輸入和第三卷積層的輸入,第二卷積層的輸出連接第二激活函數ReLU6的輸入,第二激活函數ReLU6的輸出和第三卷積層的輸出進行逐元素相乘后的輸出連接第四卷積層的輸入,第四卷積層的輸出連接第三批歸一化層的輸入,第三批歸一化層的輸出連接第二深度可分離卷積層的輸入,第二深度可分離卷積層的輸出和表格特征提取模塊的輸入進行相加后的輸出即為表格特征提取模塊的輸出; 步驟S3中,九個表格特征融合模塊中的任一表格特征融合模塊包括兩個可變形卷積層、一個轉置卷積上采樣層、二個批歸一化層和二個激活函數ReLU;具體為: 表格特征融合模塊的第二輸入連接第一可變形卷積層的輸入,第一可變形卷積層的輸出連接第四批歸一化層的輸入,第四批歸一化層的輸出連接第一激活函數ReLU的輸入,第一激活函數ReLU的輸出連接第一轉置卷積上采樣層的輸入,第一轉置卷積上采樣層的輸出和表格特征融合模塊的第一輸入進行相加后的輸出連接第二可變形卷積層的輸入,第二可變形卷積層的輸出連接第五批歸一化層的輸入,第五批歸一化層的輸出連接第二激活函數ReLU的輸入,第二激活函數ReLU的輸出即為表格特征融合模塊的輸出。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南昌航空大學,其通訊地址為:330000 江西省南昌市紅谷灘區豐和南大道696號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。