山西大學(xué)徐麗云獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉山西大學(xué)申請的專利一種基于雙路UNET的分?jǐn)?shù)域信息交互的語音增強(qiáng)方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN116052716B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-22發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202310063213.8,技術(shù)領(lǐng)域涉及:G10L25/30;該發(fā)明授權(quán)一種基于雙路UNET的分?jǐn)?shù)域信息交互的語音增強(qiáng)方法是由徐麗云;張彤設(shè)計(jì)研發(fā)完成,并于2023-01-17向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種基于雙路UNET的分?jǐn)?shù)域信息交互的語音增強(qiáng)方法在說明書摘要公布了:本發(fā)明涉及一種基于雙路UNET的分?jǐn)?shù)域信息交互的語音增強(qiáng)方法。包括:收集純凈的語音和噪聲;將收集到的數(shù)據(jù)按照目標(biāo)信噪比混合,提取相應(yīng)的幅度譜特征和相位譜特征和含噪語音的分?jǐn)?shù)域特征作為網(wǎng)絡(luò)輸入;由幅度譜計(jì)算網(wǎng)絡(luò)的訓(xùn)練目標(biāo):語音掩碼與噪聲掩碼;構(gòu)建基于語音和噪聲信息交互的網(wǎng)絡(luò)模型和基于時域譜、頻域譜、語音噪聲掩碼的損失函數(shù);將處理好的分?jǐn)?shù)域特征輸入網(wǎng)絡(luò),最小化損失函數(shù)反向傳播,優(yōu)化網(wǎng)絡(luò)模型中的參數(shù);提取待增強(qiáng)語音信號的分?jǐn)?shù)域特征,輸入訓(xùn)練好的網(wǎng)絡(luò)并輸出目標(biāo),由幅度譜和相位譜重構(gòu)增強(qiáng)的信號。本發(fā)明通過不同階次分?jǐn)?shù)域表征更多語音特征,并在雙路分支之間建立語音和噪聲的信息交互協(xié)同工作,達(dá)到更好的語音增強(qiáng)效果。
本發(fā)明授權(quán)一種基于雙路UNET的分?jǐn)?shù)域信息交互的語音增強(qiáng)方法在權(quán)利要求書中公布了:1.一種基于雙路UNET的分?jǐn)?shù)域信息交互的語音增強(qiáng)方法,其特征在于,包括以下步驟: (1)收集訓(xùn)練集語音,包括純凈的說話人語音s,和噪聲數(shù)據(jù)n; (2)訓(xùn)練數(shù)據(jù)和訓(xùn)練特征提取,將收集到的語音和噪聲按照目標(biāo)信噪比進(jìn)行混合,并提取語音、噪聲、含噪語音的幅度譜特征、相位譜特征和含噪語音的分?jǐn)?shù)域特征作為網(wǎng)絡(luò)模型的輸入數(shù)據(jù); (3)訓(xùn)練目標(biāo)提取,根據(jù)步驟(2)中得到的幅度譜計(jì)算網(wǎng)絡(luò)的訓(xùn)練目標(biāo):語音掩碼與噪聲掩碼; (4)構(gòu)建基于雙路UNET的語音和噪聲信息交互的網(wǎng)絡(luò)模型和基于時域譜、頻域譜、語音噪聲掩碼的損失函數(shù); (5)訓(xùn)練模型,將步驟(2)中處理好的分?jǐn)?shù)域特征輸入網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到的網(wǎng)絡(luò)固化出來用于后續(xù)預(yù)測結(jié)果; (6)測試結(jié)果,將待增強(qiáng)語音信號根據(jù)步驟(2)提取分?jǐn)?shù)域特征,將特征輸入步驟(5)訓(xùn)練好的網(wǎng)絡(luò)模型進(jìn)行預(yù)測,輸出估計(jì)語音掩碼和噪聲掩碼,結(jié)合步驟(2)中得到的幅度譜和相位譜重構(gòu)得到預(yù)測增強(qiáng)的語音信號; 所述步驟(4)中構(gòu)建的基于語音和噪聲信息交互的網(wǎng)絡(luò)模型包含語音通道、噪聲通道,其中語音通道和噪聲通道具有相同的網(wǎng)絡(luò)結(jié)構(gòu),包含編碼層、殘差多頭自注意力模塊和解碼層,中間穿插交互模塊進(jìn)行語音和噪聲的信息互通,最后對兩路通道的估計(jì)結(jié)果進(jìn)行融合,根據(jù)損失函數(shù)反向傳播調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán)重和偏置,使神經(jīng)網(wǎng)絡(luò)達(dá)到全局最優(yōu)解,神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練完成,將訓(xùn)練好的權(quán)重固化出來,供每次算法調(diào)用。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人山西大學(xué),其通訊地址為:030006 山西省太原市小店區(qū)塢城路92號山西大學(xué)科技樓803;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- LG電子株式會社張?jiān)缀斋@國家專利權(quán)
- 中核新科(天津)精密機(jī)械制造有限公司王斌獲國家專利權(quán)
- 北京小米移動軟件有限公司辛春雷獲國家專利權(quán)
- 國立大學(xué)法人廣島大學(xué)田原榮俊獲國家專利權(quán)
- 廣東美芝制冷設(shè)備有限公司小津政雄獲國家專利權(quán)
- 雅馬哈株式會社五藤三貴獲國家專利權(quán)
- 福特全球技術(shù)公司邁克爾·E·雷布林獲國家專利權(quán)
- 福特全球技術(shù)公司梁峰獲國家專利權(quán)
- 中核新科(天津)精密機(jī)械制造有限公司齊鐵城獲國家專利權(quán)
- 德克斯康公司J·哈拉克獲國家專利權(quán)