清華大學深圳國際研究生院袁春獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉清華大學深圳國際研究生院申請的專利一種基于筆劃區域分割策略的視覺文本檢測方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117115824B 。
龍圖騰網通過國家知識產權局官網在2025-08-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310617471.6,技術領域涉及:G06V30/148;該發明授權一種基于筆劃區域分割策略的視覺文本檢測方法是由袁春;李磊設計研發完成,并于2023-05-29向國家知識產權局提交的專利申請。
本一種基于筆劃區域分割策略的視覺文本檢測方法在說明書摘要公布了:一種基于筆劃區域分割策略的視覺文本檢測方法,包括如下步驟:S1、通過基于卷積神經網絡的前端處理模塊,針對輸入的文本圖像執行特征提取和多級區域預測;S2、依據文本區域的多級預測結果提取文本級和筆劃級的區域候選框,進而構建層次化的局部圖結構;S3、通過基于圖神經網絡的后端處理模塊,在各個局部圖執行基于多級圖節點的節點特征聚合和關系推理,推斷不同級別圖節點之間的關系并進行鏈接預測,將節點進行分組進而組成整體的文本實例檢測結果。在視覺文本檢測研究領域廣泛采用的標準評估數據集上進行了實驗,驗證了本發明視覺文本檢測方法的有效性、高精度和良好的泛化能力。
本發明授權一種基于筆劃區域分割策略的視覺文本檢測方法在權利要求書中公布了:1.一種基于筆劃區域分割策略的視覺文本檢測方法,其特征在于,包括如下步驟: S1、通過基于卷積神經網絡的前端處理模塊,對輸入的文本圖像執行特征提取和多級區域預測;所述前端處理模塊包括主干圖像特征提取網絡、文本區域預測網絡和筆劃區域預測網絡,通過一系列堆疊在特征金字塔主干圖像特征提取網絡之上的卷積層來執行與文本區域相關的多級預測; S2、依據文本區域的多級預測結果提取文本級和筆劃級的區域候選框,各候選框所表示的圖像區域作為圖節點組成多個局部圖結構,進而構建層次化的局部圖結構; S3、通過基于圖神經網絡的后端處理模塊,在各個局部圖執行基于多級圖節點的節點特征聚合和關系推理,推斷不同級別圖節點之間的關系并進行鏈接預測,根據各個文本級節點之間的鏈接關系將節點進行分組進而組成整體的文本實例檢測結果; 步驟S1中,所述筆劃區域預測網絡將各個文本區域中的字符內容與復雜背景分離,其中,結合圖像低級語義和高級語義信息來生成文本區域中精細的筆劃分割表示,以指導后續的文本檢測過程; 所述筆劃區域預測網絡包括兩個階段的預測過程; 1從主干網絡獲取到的輸入圖像的高級特征表示中提取與文本相關的特征;具體地,從輸入圖像中裁剪出TR的外部矩形OTR,并利用全局池化層結合連續的卷積層來提取從主干網絡獲取的OTR區域特征;利用若干池化層和多層感知器網絡以及相關的非線性激活函數來計算輸入圖像的通道注意力特征圖,以辨別和度量主干網絡中的不同網絡層對文本區域表示的相對貢獻;在此期間,將提取到的輸入特征圖上采樣到與輸入圖像相同的分辨率大小,然后將其乘以得到的通道注意力特征圖從而實現對輸入圖像的語義信息蒸餾操作;由此,獲得文本圖像語義表示; 2精細建模文本區域的筆劃表示,通過從正交方向上引入正交卷積網絡來增強細粒度的筆劃字符分割表示;具體地,將文本區域外接矩形OTR的3通道RGB原始輸入特征作為補充的低級圖像語義信息,并將其與獲得的文本圖像語義表示相融合。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人清華大學深圳國際研究生院,其通訊地址為:518055 廣東省深圳市南山區西麗街道深圳大學城清華校區A棟二樓;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。