湖南大學趙歡獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉湖南大學申請的專利一種基于半監督語音情感識別框架的深度情感聚類方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116230019B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211472628.2,技術領域涉及:G10L25/63;該發明授權一種基于半監督語音情感識別框架的深度情感聚類方法是由趙歡;李俐璇;查徐鵬;王禹江設計研發完成,并于2022-11-17向國家知識產權局提交的專利申請。
本一種基于半監督語音情感識別框架的深度情感聚類方法在說明書摘要公布了:本發明涉及一種基于半監督語音情感識別框架的深度情感聚類方法,屬于語音情感識別技術領域,對輸入的語料庫中的音頻進行預處理;使用Attn?Convolution網絡對預處理后的語音數據在空間上進行特征提取;使用BiGRU網絡對預處理后的語音數據在時間上進行特征提取;將提取出的語音特征使用ADD函數進行特征融合;在聚類分類器模塊中對未標記的數據集進行偽標簽分配;在情感回歸器中對每個句子i的語音片段sij進行回歸預測;使用新的CCC?CE聯合損失作為回歸器與分類器模型的損失函數。有益效果在于,使用較少未標記數據的模型框架比現有的半監督框架實現了更好的語音表示,并且在下游任務中優于最先進的方法。
本發明授權一種基于半監督語音情感識別框架的深度情感聚類方法在權利要求書中公布了:1.一種基于半監督語音情感識別框架的深度情感聚類方法,其特征在于, 基于深度情感聚類方法的時空共同捕獲的半監督語音情感識別框架,簡稱ACG-EmoCluster,包括以下方法: 步驟1,對輸入的語料庫中的音頻進行預處理; 步驟2,使用由自注意力機制與卷積操作搭建而成的深度學習網絡,簡稱Attn-Convolution網絡,對預處理后的語音數據在空間上進行特征提取; 步驟3,使用由雙向門控單元構建的深度學習網絡,簡稱BiGRU網絡,對預處理后的語音數據在時間上進行特征提取; 步驟4,將提取出的語音特征使用集成于pytorch框架的矩陣加和函數,簡稱ADD函數,進行特征融合; 步驟5,在聚類分類器模塊中對未標記的數據集進行偽標簽分配; 步驟6,在情感回歸器中對每個句子i的語音片段sij進行回歸預測,并將n個語音片段{si1,……,sin}進行歸一化后的結果作為句子i的預測結果; 步驟7,使用新的CCC-CE聯合損失作為回歸器與分類器模型的損失函數;CCC為相關一致性系數損失,用于情感回歸器中;CE為交叉熵損失,用于聚類分類器中。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人湖南大學,其通訊地址為:410082 湖南省長沙市岳麓區湖南大學信息科學與工程學院;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。