北京漢儀創新科技股份有限公司;上海驛創信息技術有限公司劉溪獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京漢儀創新科技股份有限公司;上海驛創信息技術有限公司申請的專利一種自然場景下的文本檢測方法、系統、設備和介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115147844B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210724281.X,技術領域涉及:G06V30/148;該發明授權一種自然場景下的文本檢測方法、系統、設備和介質是由劉溪設計研發完成,并于2022-06-23向國家知識產權局提交的專利申請。
本一種自然場景下的文本檢測方法、系統、設備和介質在說明書摘要公布了:本公開涉及文本檢測領域,提供一種自然場景下的文本檢測方法、系統、設備和介質,所述方法包括:將文本實例的損失函數Lc、縮小后的文本實例的損失函數Ls和最大比例縮小后的文本實例的像素鏈損失函數Llink作為整體損失函數L,將所述整體損失函數L作為resNet+FPN特征金字塔網絡模型的損失函數;對所述resNet+FPN特征金字塔網絡模型進行訓練;將自然場景下的文本圖像輸入訓練后的resNet+FPN特征金字塔網絡模型實現文本檢測。本公開可以很好的適應各類場景和文本布局,特別是在文本行中字符間隔較大和文本行靠近的情況有很好的表現。
本發明授權一種自然場景下的文本檢測方法、系統、設備和介質在權利要求書中公布了:1.一種自然場景下的文本檢測方法,其特征在于,包括以下步驟: 將文本實例的損失函數Lc、縮小后的文本實例的損失函數Ls和最大比例縮小后的文本實例的像素鏈損失函數Llink作為整體損失函數L,將所述整體損失函數L作為resNet+FPN特征金字塔網絡模型的損失函數;其中,所述resNet+FPN特征金字塔網絡模型的輸出層有14個通道,其中前5個通道為文本核通道,第6個通道為文本實例通道,后8個通道為‘像素鏈’通道;8個通道分別表示像素鄰域的8像素都屬于同一個文本實例; 對所述resNet+FPN特征金字塔網絡模型進行訓練,包括所述resNet+FPN特征金字塔網絡模型的后八個通道對應的8個標簽對應像素的8個鄰居像素位置分別為:topleft,top,topright,left,right,bottomleft,bottom,bottomright; , n∈[topleft,top,toprignt,left,right,bottomleft,bottom,bottomright],其中表示‘像素鏈’標簽在x,y位置的值,n表示鄰居類別,S min x n ,y n 表示最小輪廓標簽在x n ,y n 的值,x n ,y n 代表x,y位置的鄰居像素位置; 將自然場景下的文本圖像輸入訓練后的resNet+FPN特征金字塔網絡模型實現文本檢測。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京漢儀創新科技股份有限公司;上海驛創信息技術有限公司,其通訊地址為:100089 北京市海淀區翠微路2號院五區2號樓二層201;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。