同濟大學張冬冬獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉同濟大學申請的專利一種基于改進PP-OCRv3的廠站接線圖文本自動檢測和識別方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117152784B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311000952.9,技術領域涉及:G06V30/422;該發明授權一種基于改進PP-OCRv3的廠站接線圖文本自動檢測和識別方法是由張冬冬;趙宇倩設計研發完成,并于2023-08-09向國家知識產權局提交的專利申請。
本一種基于改進PP-OCRv3的廠站接線圖文本自動檢測和識別方法在說明書摘要公布了:本發明公開了一種基于改進PP?OCRv3的廠站接線圖文本自動檢測和識別方法。本發明針對現有基于深度學習的電網圖紙文本檢測識別方法在處理多尺度、多方向、形狀不規則的緊湊文本方面的局限性問題,提出了基于改進PP?OCRv3的廠站接線圖文本自動檢測和識別方法。利用基于像素行聚類的區域重分割模塊,糾正了包含垂直和水平字符的不規則形狀文本的檢測錯誤。通過BiFPN模塊中引入通道注意力機制和深度可分卷積,提高了識別模型對不同尺度輸入圖像的魯棒性。利用基于區域擴展和切割的字符重識別模塊,減少了簡單字符和密集文本對模型的不利影響。實驗結果表明,本發明通過對PP?OCRv3的一系列改進,可以顯著提高廠站接線圖中文本的檢測和識別精度。
本發明授權一種基于改進PP-OCRv3的廠站接線圖文本自動檢測和識別方法在權利要求書中公布了:1.一種基于改進PP-OCRv3的廠站接線圖文本自動檢測和識別方法,其特征在于,包括如下步驟: 步驟1:將電網廠站接線圖紙數據集分為訓練集和測試集,分別用于文本檢測和識別兩個模型的訓練和測試; 步驟2:對輸入圖像進行文本位置檢測,并構建區域重分割模塊,用于對文本檢測結果進行調整,解決對于同時包含橫向和縱向文字的不規則文本的精確檢測,據此得到文本候選框; 步驟3:構建基于改進BiFPN的特征提取和融合網絡,對經裁剪的文本圖像提取特征信息,得到序列特征;所述基于改進BiFPN的特征提取和融合網絡是在PP-OCRv3的MobileNetv1的基礎上設計的;在MobileNetv1之后,引入了一種改進BiFPN特征融合模塊,用于提取廠站接線圖中不同形狀文本的多尺度特征;在BiFPN的末端增加一個通道注意力模塊,增強高級特征映射中的信息,提高全局特征擬合能力;采用深度可分離卷積代替網絡中的所有卷積以克服參數增加所導致的效率降低問題;使用Hardswish作為激活函數; 步驟4:對序列特征進行編碼和解碼,并構建字符重識別模塊,通過對簡單中文字符和多行數字文本的識別結果進行微調,改善整體精度,據此得到文本識別結果; 步驟5:將文本候選框和文本識別結果分別與相應真值計算得到檢測和識別兩個網絡模型的損失; 步驟6:根據損失,使用Adam優化器分別優化檢測和識別兩個網絡模型; 步驟7:循環執行步驟2-6至兩個網絡模型均收斂,保存兩個模型文件; 步驟8:將測試圖紙輸入檢測模型中預測得到文本候選框,再將裁剪后的文本圖像輸入識別模型預測得到文本識別結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人同濟大學,其通訊地址為:200092 上海市楊浦區四平路1239號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。