廣東海聊科技有限公司查徐鵬獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉廣東海聊科技有限公司申請的專利基于自監督學習的語音情感識別方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116434782B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211524793.8,技術領域涉及:G10L25/63;該發明授權基于自監督學習的語音情感識別方法是由查徐鵬;顏志威;馬炎南;趙歡;黃念鑫設計研發完成,并于2022-11-30向國家知識產權局提交的專利申請。
本基于自監督學習的語音情感識別方法在說明書摘要公布了:本發明公開了一種基于自監督學習的語音情感識別方法,包括獲取現有的語音數據集樣本;對樣本數據進行采樣和預處理得到有標簽語音數據集;對有標簽語音數據集進行數據增強得到有標簽混合語音數據集;采用卷積神經網絡處理有標簽混合語音數據集得到語音數據的高級語義特征信息;采用注意力機制處理高級語義特征信息得到語音數據的全局特征信息;采用插入查詢和注意力機制處理全局特征信息得到語音數據的局部特征信息;處理局部特征信息得到最終的語音情感識別結果。本發明能夠提取語音數據的全局特征信息,解決了當前語音情感識別領域標簽數據的稀缺所導致模型性能差、泛化性低的問題;可靠性高、精確性好,性能較好,適用范圍廣。
本發明授權基于自監督學習的語音情感識別方法在權利要求書中公布了:1.一種基于自監督學習的語音情感識別方法,包括如下步驟: S1.獲取現有的語音數據集樣本; S2.對步驟S1獲取的樣本數據進行采樣和預處理,得到有標簽語音數據集; S3.對步驟S2得到的有標簽語音數據集進行數據增強,從而得到有標簽混合語音數據集;具體包括如下步驟: 在步驟S2得到的有標簽語音數據集中,任意選取兩個不同類別的語音數據,通過VMixup技術構建若干個混合語音樣本,從而對有標簽語音數據集進行擴充,得到有標簽混合語音數據集; 其中,所述的通過VMixup技術構建若干個混合語音樣本,具體包括如下步驟: A.從有標簽語音數據集中,任意選取兩個不同類別的語音數據樣本x1和x2,語音數據樣本的長度依次為|x1|和|x2|,|x1|=|x2|且等于采樣幀數;同時獲取語音數據樣本x1所對應的情感類別標簽y1、語音數據樣本x2所對應的情感類別標簽y2;設定超參數α∈{α1,α2,...,αn}和隨機選取超參數β1∈[0,β1max]和β2∈[0,β2max],其中α1~αn均小于1,β1max<1,β2max<1; B.采用如下算式對語音數據樣本x1和x2進行融合操作: 式中αx1表示在語音樣本x1中截取第β1*|x1|幀至第α+β1*|x1|-1幀的語音特征片段,算式表達為αx1=x1[β1*|x1|:α+β1*|x1|-1];1-αx2表示在語音樣本x2中刪除第β2*|x2|幀至第α+β2*|x2|-1幀的語音特征片段后的語音片段,算式表達為1-αx2=x2[1:β2*|x2|-1]+x2[α+β2*|x2|:|x2|];為融合后的混合語音樣本,表示將語音特征片段αx1插入到語音片段x2[1:β2*|x2|-1]和x2[α+β2*|x2|:|x2|]之間;αy1表示語音樣本x1所對應的情感類別標簽y1的α倍;1-αy2表示語音樣本x2所對應的情感類別標簽y2的1-α倍;為混合語音樣本的所對應的情感類別標簽; C.將得到的混合語音樣本對應的情感類別標簽和混合語音樣本的附加信息β2,α+β2一同加入有標簽語音數據集中; D.重復步驟B和步驟C共n次,每一次重復時取不同的α值; E.對有標簽語音數據集中的每一個原始的語音樣本都添加一個附加信息0,0,并將附加信息作為語音樣本的insertposition; F.最終,得到有標簽混合語音數據集; S4.采用卷積神經網絡對步驟S3得到的有標簽混合語音數據集進行處理,得到語音數據的高級語義特征信息; S5.采用注意力機制對步驟S4得到的高級語義特征信息進行處理,得到語音數據的全局特征信息; S6.采用插入查詢和注意力機制對步驟S5得到的全局特征信息進行處理,得到語音數據的局部特征信息; S7.對步驟S6得到的局部特征信息進行處理,得到最終的語音情感識別結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廣東海聊科技有限公司,其通訊地址為:528200 廣東省佛山市南海區獅山鎮軟件園桃園路南海產業智庫城一期B座B326、B328、B330、B331、B332、B333、B334、B336室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。