上海應用技術大學陳彪獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉上海應用技術大學申請的專利基于多級狀態特征優化的手語識別方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116246341B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310025040.0,技術領域涉及:G06V40/20;該發明授權基于多級狀態特征優化的手語識別方法是由陳彪;林濤;王瑞霞;師與;張亞博;姜楠設計研發完成,并于2023-01-09向國家知識產權局提交的專利申請。
本基于多級狀態特征優化的手語識別方法在說明書摘要公布了:本發明涉及一種基于多級狀態特征優化的手語識別方法,構建手語識別模型對手語進行識別,手語識別模型包括依次連接的Resnet?18網絡、兩級Gloss編碼器和CTC解碼器,在處理過程中更加高效,同時該結構對于用戶的輸入圖像幀尺寸不做限制,更適合實際部署應用;方法參考了手語語義的構成規則,利用兩級Gloss編碼器將圖像幀序列按照語義規則進行二次構建,對手語特征之間的關聯性深入挖掘;通過多個特征狀態優化的決策融合機制,對模型的局部特征和全局輸出進行聯合優化,得到最后的識別效果。
本發明授權基于多級狀態特征優化的手語識別方法在權利要求書中公布了:1.一種基于多級狀態特征優化的手語識別方法,其特征在于,構建手語識別模型對手語進行識別,手語識別模型包括依次連接的Resnet-18網絡、兩級Gloss編碼器和CTC解碼器;連續的n個視頻幀送入Resnet-18網絡進行基于Resnet-18網絡的圖像局部特征提取,提取的特征通過兩級Gloss編碼器中的G1特征提取器和G2特征提取器分別對手語的空間變化與時間關聯進行二次特征提取和融合,形成Gloss特征,最后利用CTC解碼器對Gloss特征進行識別; 手語識別模型訓練中:通過多個特征狀態優化的決策融合機制,分別對經過Resnet-18網絡、兩級Gloss編碼器的多特征狀態使用CTC損失函數進行局部優化,同時采用KLDiv損失函數對經過Resnet-18網絡和G2特征提取器的特征狀態進行修正,通過不斷迭代訓練,對模型的局部特征和全局輸出進行聯合優化,得到最后的識別效果; 所述兩級Gloss編碼器由G1特征提取器和G2特征提取器構成;G1特征提取器在時間維度上對特征進行處理,G2特征提取器在空間維度上對特征進行處理; 所述的G1特征提取器由兩個包含一個1D-CNN網絡和一個最大池化層MP的雙層結構疊加而成,在時間維度上處理輸入的特征,其網絡結構為1D-CNN-MP-1D-CNN-MP; 所述的G2特征提取器緊跟在G1特征提取器之后,僅由一個1D-CNN網絡構成,在空間維度上對輸入的特征; 所述兩級Gloss編碼器處理步驟,包括: 步驟1:G1特征提取器采用滑動窗口思想處理輸入的擴展特征集S,形成一級Gloss特征集G1={g 1,g 2,…,g x};經過G1特征提取器處理,特征集G1包含的特征數量將與擴展特征集S包含的特征數量不同;假定Q 0=m,m為擴展特征集S包含的特征數量,則特征集G1包含的特征數量x的計算方式如下: T i=Q i-1+2p-ks+1,i∈{1,2}1 Q i =T i+2pm-kmsm+1,i∈{1,2}2 x=Q 23 其中,T i和Q i分別表示第i次經過1D-CNN處理后的特征數量和第i次經過MP處理后的特征數量,p、k、s分別代表1D-CNN的填充大小、濾波器大小和滑動步長,pm、km、sm分別代表MP的填充大小、濾波器大小和滑動步長; 步驟2:G1特征提取器采用1D-CNN進一步提取一級Gloss特征集G1的空間特征,輸出二級Gloss特征集G2={g 1 ’,g 2 ’,…,g x ’},這個操作不改變特征集的大小。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人上海應用技術大學,其通訊地址為:200235 上海市徐匯區漕寶路120號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。