深圳市金大智能創新科技有限公司王茂林獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉深圳市金大智能創新科技有限公司申請的專利一種視覺文檔內容提取及分析系統和方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120071372B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510537626.4,技術領域涉及:G06V30/413;該發明授權一種視覺文檔內容提取及分析系統和方法是由王茂林;張鵬設計研發完成,并于2025-04-27向國家知識產權局提交的專利申請。
本一種視覺文檔內容提取及分析系統和方法在說明書摘要公布了:本發明公開了一種視覺文檔內容提取及分析系統和方法,該系統包括多任務統一建模模塊和內容提取與信息抽取解碼模塊,多任務統一建模模塊包括多模態特征提取子模塊、多模態表征優化子模塊、任務提示生成子模塊,內容提取與信息抽取解碼模塊包括所述的內容提取與信息抽取解碼模塊包括、統一解碼子模塊。該方法包括步驟:S1、通過多任務統一建模模塊提取文檔圖像的多模態特征,并生成任務提示向量;S2、基于所述多模態特征與任務提示向量,利用內容提取與信息抽取解碼模塊同步完成文檔區域解析、語義標簽分配及結構化信息輸出。本發明統一建模實現了多任務的統一處理,有效解決了傳統方法中任務分離帶來的效率損失和一致性問題。
本發明授權一種視覺文檔內容提取及分析系統和方法在權利要求書中公布了:1.一種視覺文檔內容提取及分析方法,其特征在于,包括以下步驟: S1、通過多任務統一建模模塊提取文檔圖像的多模態特征,并生成任務提示向量; S2、基于所述多模態特征與任務提示向量,利用內容提取與信息抽取解碼模塊同步完成文檔區域解析、語義標簽分配及結構化信息輸出; 所述步驟S1中包括有S11、提取輸入文檔圖像中的多模態特征并通過視覺語言掩碼預測技術對輸入文檔圖像進行像素掩碼重建預測與上下文挖掘; S12、融合視覺、文本和位置信息,優化多模態表征空間; S13、通過提示學習生成任務提示向量,將多模態識別任務統一為序列生成解析框架; 所述步驟S2中包括有S21、融合視覺特征、文本語義和布局信息,生成統一語義表征; S22、通過共享解碼器將文檔區域與語義標簽對應,利用動態權重聯合損失函數平衡區域檢測與語義分配。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人深圳市金大智能創新科技有限公司,其通訊地址為:518100 廣東省深圳市寶安區沙井街道坣崗社區環鎮路12號廠房3層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。