華南理工大學張軍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉華南理工大學申請的專利一種基于多任務網絡的麥克風陣列語音增強系統及方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114694670B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210353984.6,技術領域涉及:G10L21/0208;該發明授權一種基于多任務網絡的麥克風陣列語音增強系統及方法是由張軍;賴志鵬;寧更新;馮義志;余華;陳芳炯;溫淼文;季飛設計研發完成,并于2022-04-06向國家知識產權局提交的專利申請。
本一種基于多任務網絡的麥克風陣列語音增強系統及方法在說明書摘要公布了:本發明公開了一種基于多任務網絡的麥克風陣列語音增強系統及方法,該系統由語音預處理模塊、多任務網絡模塊、多任務損失統計模塊、網絡權重計算模塊和語音重構模塊組成。其中,語音預處理模塊獲取陣列語音、參考回聲語音和各個任務目標語音作為輸入語音并進行預處理;多任務網絡模塊完成陣列語音各聲道的去混響、回聲消除、降噪任務,并將多聲道語音融合輸出為增強后的語音;多任務損失統計模塊用于計算多任務網絡模塊中各任務的損失值,并統計網絡的總損失;網絡權重計算模塊根據網絡的總損失計算梯度,將梯度反向傳播,計算得到更新后網絡的權重;語音重構模塊完成從頻域特征到時域語音的映射,得到增強后的干凈語音。
本發明授權一種基于多任務網絡的麥克風陣列語音增強系統及方法在權利要求書中公布了:1.一種基于多任務網絡的麥克風陣列語音增強系統,其特征在于,所述麥克風陣列語音增強系統包括語音預處理模塊、多任務網絡模塊、多任務損失統計模塊、網絡權重計算模塊和語音重構模塊,其中, 所述語音預處理模塊分別與多任務網絡模塊和多任務損失統計模塊連接,用于獲取陣列語音、參考回聲語音和各個任務目標語音作為輸入語音,對輸入語音進行預處理,所述預處理包含語音信號的歸一化、提取各聲道語音和參考回聲語音的對數幅度譜; 所述多任務網絡模塊分別與語音預處理模塊、多任務損失統計模塊、網絡權重計算模塊和語音重構模塊連接,完成陣列語音各聲道的去混響、回聲消除、降噪任務,并將多聲道語音融合輸出為增強后的語音;所述多任務網絡模塊,包括M條并聯的聲道分支網絡和1個聲道融合子網絡,上述每條聲道分支網絡包括依次順序連接的1個去混響子網絡、1個回聲消除子網絡和1個降噪子網絡,其中M與語音預處理模塊中麥克風陣列的陣元數目相同,每條聲道分支網絡中去混響子網絡與回聲消除子網絡、所述多任務損失統計模塊和所述語音預處理模塊連接,完成對該聲道的混響去除任務;每條聲道分支網絡中的回聲消除子網絡與去混響子網絡、降噪子網絡、所述語音預處理模塊和所述多任務損失統計模塊連接,利用參考的回聲信號,消除該聲道的回聲分量;每條聲道分支網絡中的降噪子網絡與回聲消除子網絡、聲道融合子網絡和所述多任務損失統計模塊連接,消除該聲道中的噪聲分量;所述聲道融合子網絡分別與M條聲道分支網絡中的降噪子網絡、所述多任務損失統計模塊和所述網絡權重計算模塊連接,利用陣列語音各聲道包含的空間信息進行二次增強; 所述多任務損失統計模塊分別與多任務網絡模塊和網絡權重計算模塊連接,計算多任務網絡模塊中各任務的損失值,并統計網絡的總損失; 所述網絡權重計算模塊分別與多任務網絡模塊和多任務損失統計模塊連接,根據網絡的總損失計算梯度,將梯度反向傳播,計算得到更新后網絡的權重; 所述語音重構模塊與多任務網絡模塊連接,完成從頻域特征到時域語音的映射,得到增強后的干凈語音。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人華南理工大學,其通訊地址為:510640 廣東省廣州市天河區五山路381號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。