北京交通大學盧思洋獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉北京交通大學申請的專利一種基于端到端神經(jīng)網(wǎng)絡的木板印刷滿文識別方法獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN115862038B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-08-29發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202211405330.X,技術領域涉及:G06V30/244;該發(fā)明授權一種基于端到端神經(jīng)網(wǎng)絡的木板印刷滿文識別方法是由盧思洋;王志煒;魏翔;盧葦;王明泉設計研發(fā)完成,并于2022-11-10向國家知識產(chǎn)權局提交的專利申請。
本一種基于端到端神經(jīng)網(wǎng)絡的木板印刷滿文識別方法在說明書摘要公布了:本發(fā)明提供了一種基于端到端神經(jīng)網(wǎng)絡的木板印刷滿文識別方法。該方法包括:從滿文古籍圖片中切割出獨立的滿文單詞,將每個滿文單詞用一個滿文單詞圖片來表示;使用卷積神經(jīng)網(wǎng)絡CNN對滿文單詞圖片進行卷積操作時,提取出滿文單詞圖片的特征向量;使用長短期記憶網(wǎng)絡LSTM處理CNN提取出的特征向量,得到向量序列;采用連接性時序分類算法CTC算法將LSTM輸出的向量序列轉(zhuǎn)化為對應滿文單詞的標簽序列,根據(jù)標簽序列對滿文單詞進行識別。本發(fā)明方法可以有效地從大量的印刷滿文圖片中提取出清晰、可拆分且通用的特征并加以識別,同時對上下文中相關聯(lián)的特征信息進行有效的篩選與關聯(lián),進而獲得高識別準確率的印刷滿文識別模型。
本發(fā)明授權一種基于端到端神經(jīng)網(wǎng)絡的木板印刷滿文識別方法在權利要求書中公布了:1.一種基于端到端神經(jīng)網(wǎng)絡的木板印刷滿文識別方法,其特征在于,包括: 從滿文古籍圖片中切割出獨立的滿文單詞,將每個滿文單詞用一個滿文單詞圖片來表示; 使用卷積神經(jīng)網(wǎng)絡CNN對滿文單詞圖片進行卷積操作,提取出滿文單詞圖片的特征向量; 使用長短期記憶網(wǎng)絡LSTM處理CNN提取出的特征向量,得到含有語義信息的向量序列; 采用連接性時序分類算法CTC算法將LSTM輸出的向量序列轉(zhuǎn)化為對應滿文單詞的標簽序列,根據(jù)標簽序列輸出滿文單詞的識別結(jié)果; 所述的從滿文古籍圖片中切割出獨立的滿文單詞,將每個滿文單詞用一個滿文單詞圖片來表示,包括: 從數(shù)字化的每一頁滿文古籍圖片中切割出獨立的滿文單詞,將每個滿文單詞用一個長寬不同的滿文單詞圖片來表示,將所有滿文單詞圖片都縮放到相同的大小,在保持單詞圖片的縱橫比的前提下將所有單詞圖片歸一化為相同的寬度,將每個滿文單詞圖片逆時針旋轉(zhuǎn)90度,為所有的滿文字母分配不同的標簽,用字形編碼注釋所有提取出的木板印刷滿文單詞; 所述的采用連接性時序分類算法CTC算法將LSTM輸出的向量序列轉(zhuǎn)化為對應滿文單詞的標簽序列,根據(jù)標簽序列對滿文單詞進行識別,包括: 采用CTC算法將LSTM輸出的向量序列轉(zhuǎn)化為對應滿文單詞的標簽序列,計算并對比不同標簽序列之間的條件概率,并將其中條件概率值最高的標簽序列作為預測的結(jié)果輸出,每個滿文單詞中字母的條件概率定義為在某一時刻觀察到相應字母圖片的概率,而整個滿文單詞的條件概率通用把不同字母排列組合之后對條件概率求和得到; CTC算法計算標簽序列的條件概率的過程包括:將輸入CTC算法的標簽序列用y1,y2,…,yr表示,其中T為輸入序列的長度,L表示使用的36種不同的字符標簽,L’為在L的基礎上加入了空白標簽,即L′=L∪{blank},其中blank代表空白標簽,π定義為任意可能出現(xiàn)的標簽序列,并且有π的條件概率計算方法如下: 其中表示在時刻t出現(xiàn)標簽πt的概率,pπ│y表示在序列y1,y2,…,yr中出現(xiàn)標簽序列π的條件概率; 在上定義一組多對一的映射方法B,具體描述如下:B首先移除π中的重復標簽,去除掉所有的空白標簽,得到新的標簽序列l(wèi),將l的條件概率定義為標簽序列π經(jīng)過B映射到l的條件概率之和; l的條件概率計算公式如下: 在無詞典的模式中,選取標簽序列中條件概率最高的序列作為滿文單詞的識別結(jié)果輸出,計算方法如下: hx≈Bl′#5 其中hx為最終預測的單詞標簽序列,l′表示選取具有最高條件概率的標簽序列; 在基于詞典的模式中,選取在詞典中與該單詞最相近的且條件概率最高的序列作為滿文單詞的識別結(jié)果輸出; 所述的使用CNN對滿文單詞圖片進行卷積操作時,提取出滿文單詞圖片的特征向量,包括: CNN選用多組適應于滿文單詞特征大小的卷積核,使?jié)M文單詞圖片通過CNN中的多組大小不同的卷積核,卷積核的長與寬代表了每一次卷積操作提取的特征區(qū)域大小,每一次通過卷積核之后,使用最大池化對輸出的特征圖進行降維,最大池化選取候選區(qū)域中的最大值作為整體表示,最終得到包含更多單詞紋理信息的特征向量; 所述的使用LSTM處理CNN提取出的特征向量,得到向量序列,包括: 使用包含兩個方向的LSTM處理滿文單詞圖片的特征向量,獲得特征向量中包含的各個上下文信息h1,h2,…,hT,將所有上下文信息進行綜合,得到Bi-LSTM輸出的包含上下文信息的向量序列hi: 其中和分別代表向后和向前的隱藏狀態(tài)序列,最終輸出的向量序列hi是二者的加和。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或?qū)@麢嗳?a target="_blank" rel="noopener noreferrer nofollow" href="https://iptop.www.hzsmkbearing.com.cn/list?keyword=%E5%8C%97%E4%BA%AC%E4%BA%A4%E9%80%9A%E5%A4%A7%E5%AD%A6&temp=1">北京交通大學,其通訊地址為:100044 北京市海淀區(qū)西直門外上園村3號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。