浙江孚臨科技有限公司唐科偉獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉浙江孚臨科技有限公司申請的專利LLM驅動的復雜報表OCR錯誤自校正方法及系統(tǒng)獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN120412000B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-08-29發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202510902148.2,技術領域涉及:G06V30/412;該發(fā)明授權LLM驅動的復雜報表OCR錯誤自校正方法及系統(tǒng)是由唐科偉;陳聲鴻;肖非設計研發(fā)完成,并于2025-07-01向國家知識產(chǎn)權局提交的專利申請。
本LLM驅動的復雜報表OCR錯誤自校正方法及系統(tǒng)在說明書摘要公布了:本發(fā)明公開了LLM驅動的復雜報表OCR錯誤自校正方法及系統(tǒng),包括如下步驟:S1、獲取復雜報表圖像數(shù)據(jù),執(zhí)行OCR處理,構建原始字段數(shù)據(jù)集;S2、提取上下文信息,識別語義矛盾字段,生成待校正字段集合;S3、指針生成網(wǎng)絡生成多個字段修正候選,形成候選字段集合;S4、構建多臂老虎機模型,選擇最優(yōu)字段修正結果,形成修正字段輸出集合;S5、執(zhí)行版式分析,提取圖表標題字段、圖例字段與數(shù)據(jù)區(qū)域文本;S6、圖表結構語義一致性機制,生成圖表標題字段的修正字段結果;S7、字段還原與版式重建,輸出結構化報表數(shù)據(jù)。本發(fā)明通過融合大語言模型、指針生成網(wǎng)絡與多臂老虎機機制,實現(xiàn)了復雜報表中字段的智能糾錯與結構化重建。
本發(fā)明授權LLM驅動的復雜報表OCR錯誤自校正方法及系統(tǒng)在權利要求書中公布了:1.LLM驅動的復雜報表OCR錯誤自校正方法,其特征在于,包括如下步驟: S1、獲取待處理的復雜報表圖像數(shù)據(jù),執(zhí)行光學字符識別處理,提取字段文本及對應的版式位置信息,構建原始字段數(shù)據(jù)集; S2、基于原始字段數(shù)據(jù)集,提取各字段在報表中的上下文信息,利用大語言模型對每一字段進行語義理解,識別存在語義矛盾或上下文不一致的字段,生成待校正字段集合; S3、將待校正字段集合中的每一字段,連同上下文信息輸入至指針生成網(wǎng)絡中,結合原始字段與上下文信息生成多個字段修正候選,形成候選字段集合; S4、針對候選字段集合,構建多臂老虎機模型,將每個候選字段作為一個拉桿臂,從候選字段集合中選擇當前最優(yōu)的字段修正結果,形成修正字段輸出集合; S5、對復雜報表圖像數(shù)據(jù)進行版式分析,定位包含圖表的結構區(qū)域,提取圖表標題字段、圖例字段與數(shù)據(jù)區(qū)域文本; S6、將圖表標題字段作為待校正字段,采用步驟S3中的指針生成網(wǎng)絡生成圖表標題候選字段集合,再采用步驟S4中的多臂老虎機模型選擇最優(yōu)圖表標題修正字段,并結合圖例字段與數(shù)據(jù)區(qū)域文本構建圖表結構語義一致性評價機制,生成圖表標題字段的修正字段結果; S7、根據(jù)修正字段輸出集合和修正字段結果,結合版式位置信息,進行字段還原與版式重建,生成結構化報表數(shù)據(jù)并輸出。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或專利權人浙江孚臨科技有限公司,其通訊地址為:310000 浙江省杭州市濱江區(qū)長河街道建業(yè)路511號華業(yè)大廈1808室;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。