昆明理工大學毛存禮獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉昆明理工大學申請的專利融合語言糾錯模型的老撾語圖像文本識別方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119785367B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510064847.4,技術領域涉及:G06V30/246;該發明授權融合語言糾錯模型的老撾語圖像文本識別方法及裝置是由毛存禮;林熙;余正濤;張勇丙;黃于欣;高盛祥設計研發完成,并于2025-01-15向國家知識產權局提交的專利申請。
本融合語言糾錯模型的老撾語圖像文本識別方法及裝置在說明書摘要公布了:本發明涉及融合語言糾錯模型的老撾語圖像文本識別方法及裝置,屬于自然語言處理領域。老撾語的字符結構更為復雜且存在眾多同形異義詞,為了解決老撾語圖像中形似字符識別不佳的問題,提出了本發明,本發明包括:老撾語文本圖像數據集構建、融合語言糾錯模型的老撾語圖像文本識別模型構建、融合語言糾錯模型的老撾語圖像文本識別模型訓練以及老撾語文本圖像識別四個部分構成。根據這四個部分功能模塊化制成融合語言糾錯模型的老撾語圖像文本識別裝置,有效地解決了因字形結構相似而導致的老撾語字符識別困難問題。
本發明授權融合語言糾錯模型的老撾語圖像文本識別方法及裝置在權利要求書中公布了:1.融合語言糾錯模型的老撾語圖像文本識別方法,其特征在于:所述方法包括: Step1、老撾語文本圖像數據集構建:通過人工收集、標注及校驗的方式構建一個老撾語文本圖像數據集; Step2、融合語言糾錯模型的老撾語圖像文本識別模型構建:構建基于Transfomer基礎視覺模型、基于語法修正的語言糾錯模塊、基于感知器模型的特征整形模塊和基于交叉注意力的多維度特征融合模塊; 設計基于Transformer基礎視覺模型提取老撾語的文本圖像特征及初始的文本圖像特征的文本表示; 設計基于感知器模型的特征整形模塊對提取出的文本圖像特征進行凝練和降維,得到凝練圖像特征; 設計基于語法修正的語言糾錯模塊,其編碼層對基于Transformer基礎視覺模型識別的初始的文本圖像特征的文本表示進行編碼得到源序列的隱層表示; 設計基于交叉注意力的多維度特征融合模塊對源序列的隱層表示和凝練圖像特征采用句法規則約束策略進行解碼約束,用于實現對老撾語文本圖像中文本信息的深刻挖掘; 包括: 構建基于交叉注意力的多維度特征融合模塊,在基于語法修正的語言糾錯模塊的編碼層和解碼層之間,插入新的交叉注意力層,這些注意力層的鍵和值來源于特征整形模塊生成的凝練圖像特征,而查詢則來自基于語法修正的語言糾錯模塊的輸出源序列的隱層表示H;在融合語言糾錯模型的老撾語圖像文本識別模型訓練初期,在基于交叉注意力的多維度特征融合模塊的輸出進入解碼層前引入了tanh門控機制,該機制通過雙曲正切函數tanh對輸入進行非線性變換,壓縮數據范圍到-1,1,用于捕獲復雜的非線性關系,同時增強對特征變化的敏感性并抑制極端值的影響;具體而言,基于交叉注意力的多維度特征融合模塊的輸出與門控機制的可學習標量tanhα相乘后加入殘差連接的輸入表示,其中標量α初始化為0,用于確保初始模型輸出與預訓練語言糾錯模型一致; 通過基于交叉注意力的多維度特征融合模塊將源序列的隱層表示和凝練圖像特征進行融合,并通過基于語法修正的語言糾錯模塊的解碼端進行解碼,得到最終的輸出結果; Step3、對構建好的融合語言糾錯模型的老撾語圖像文本識別模型進行訓練; Step4、老撾語文本圖像識別:將訓練收斂的模型進行封裝,部署在服務器上,開發一套API接口,通過API調用服務器上部署的融合語言糾錯模型的老撾語圖像文本識別模型,用于實現對老撾語文本圖像的識別。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人昆明理工大學,其通訊地址為:650039 云南省昆明市一二一大街文昌路68號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。