成都緯視科技有限公司唐繼勇獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉成都緯視科技有限公司申請的專利一種基于頻譜分割與深度學習的語音情感識別方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114999531B 。
龍圖騰網通過國家知識產權局官網在2025-08-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210365274.5,技術領域涉及:G10L25/63;該發明授權一種基于頻譜分割與深度學習的語音情感識別方法是由唐繼勇;郭奕;熊雪軍;蔣鑫;田涵冰設計研發完成,并于2022-04-07向國家知識產權局提交的專利申請。
本一種基于頻譜分割與深度學習的語音情感識別方法在說明書摘要公布了:本發明提出了一種基于頻譜分割與深度學習的語音情感識別方法,涉及語音識別技術領域,包括:S1、獲取ESD情感的數據集,并讀取數據集以得到音頻數據;S2、對音頻數據進行數據預處理以得到灰度語譜圖;S3、根據灰度語譜圖的不同頻段對灰度語譜圖進行頻譜分割以得到分割結果;S4、基于分割結果選取不同網絡進行情感分類以得到分類結果;S5、輸出分類結果以得到情感識別數據;本發明有效的提高了特征的利用率,從而利用語音數據對說話人的情感進行預測與分類,降低了網絡的復雜度,提高了語音情感識別的準確率,極大地提高了信息處理的效率與準確性。
本發明授權一種基于頻譜分割與深度學習的語音情感識別方法在權利要求書中公布了:1.一種基于頻譜分割與深度學習的語音情感識別方法,其特征在于,包括以下步驟: S1、獲取ESD情感的數據集,并讀取數據集以得到音頻數據; S2、對音頻數據進行數據預處理以得到灰度語譜圖,具體為: S21、讀取音頻數據,并將音頻數據轉換成一維數據; S22、對一維數據進行分幀、加窗處理以轉變為二維數據; S23、對二維數據做快速傅里葉變換以得到短時傅里葉譜; S24、將短時傅里葉譜做自乘運算以得到短時功率譜; S25、將短時功率譜的值轉化為灰度級所構成的二維圖像以得到灰度語譜圖; S3、根據灰度語譜圖的不同頻段對灰度語譜圖進行頻譜分割以得到分割結果,具體為: S31、將灰度語譜圖進行二值化以得到二值化的灰度語譜圖; S32、根據二值化的灰度語譜圖計算以得到灰度語譜圖的平均能量; S33、基于灰度語譜圖的平均能量進行繪圖以得到平均能量的包絡線; S34、對包絡線進行差分以得到差分曲線; S35、根據差分曲線獲取得到一階差分包絡線零點; S36、選取一階差分包絡線零點作為分界點對包絡線進行頻譜分割以得到分割結果; S4、基于分割結果選取不同網絡進行情感分類以得到分類結果; S5、輸出分類結果以得到情感識別數據。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人成都緯視科技有限公司,其通訊地址為:610000 四川省成都市成華區龍潭工業園成致路6號4棟1-3層1號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。