同濟(jì)大學(xué)沈瑩獲國(guó)家專(zhuān)利權(quán)
買(mǎi)專(zhuān)利賣(mài)專(zhuān)利找龍圖騰,真高效! 查專(zhuān)利查商標(biāo)用IPTOP,全免費(fèi)!專(zhuān)利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉同濟(jì)大學(xué)申請(qǐng)的專(zhuān)利一種基于聲紋特征的多人語(yǔ)音分離方法、設(shè)備及介質(zhì)獲國(guó)家發(fā)明授權(quán)專(zhuān)利權(quán),本發(fā)明授權(quán)專(zhuān)利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN113990344B 。
龍圖騰網(wǎng)通過(guò)國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-19發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專(zhuān)利申請(qǐng)?zhí)?專(zhuān)利號(hào)為:202111004878.9,技術(shù)領(lǐng)域涉及:G10L21/0272;該發(fā)明授權(quán)一種基于聲紋特征的多人語(yǔ)音分離方法、設(shè)備及介質(zhì)是由沈瑩;程詩(shī)丹;周子怡;張林;趙生捷設(shè)計(jì)研發(fā)完成,并于2021-08-30向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專(zhuān)利申請(qǐng)。
本一種基于聲紋特征的多人語(yǔ)音分離方法、設(shè)備及介質(zhì)在說(shuō)明書(shū)摘要公布了:本發(fā)明涉及一種基于聲紋特征的多人語(yǔ)音分離方法、設(shè)備及介質(zhì),該方法包括:S1:獲取目標(biāo)說(shuō)話人的聲紋特征Xref以及對(duì)混合音頻采用短時(shí)傅里葉變換提取其頻譜特征Xmix;S2:通過(guò)拼接混合音頻的頻譜特征Xmix與目標(biāo)說(shuō)話人的聲紋特征Xref得到參考聲紋特征的頻譜特征X′mix,并將頻譜特征X′mix輸入到用于捕獲低級(jí)別音頻特征的擴(kuò)張卷積層,得到語(yǔ)音分離模型的輸入特征Xinput;S3:通過(guò)基于語(yǔ)音分離模型獲取頻譜掩膜,并將其與混合音頻的頻譜特征Xmix相乘,得到預(yù)測(cè)出的目標(biāo)說(shuō)話人的純凈音頻的頻譜;通過(guò)參考混合音頻的相位譜并結(jié)合短時(shí)傅里葉逆變換,得到預(yù)測(cè)出的目標(biāo)說(shuō)話人在時(shí)域上的純凈音頻。與現(xiàn)有技術(shù)相比,本發(fā)明具有語(yǔ)音分離精度高的優(yōu)點(diǎn)。
本發(fā)明授權(quán)一種基于聲紋特征的多人語(yǔ)音分離方法、設(shè)備及介質(zhì)在權(quán)利要求書(shū)中公布了:1.一種基于聲紋特征的多人語(yǔ)音分離方法,其特征在于,該方法包括以下步驟: 步驟S1:聲紋特征提取,包括獲取目標(biāo)說(shuō)話人的聲紋特征Xref以及對(duì)混合音頻采用短時(shí)傅里葉變換提取其頻譜特征Xmix; 步驟S2:聲紋特征融合,通過(guò)拼接混合音頻的頻譜特征Xmix與目標(biāo)說(shuō)話人的聲紋特征Xref得到參考聲紋特征的頻譜特征X′mix,并將頻譜特征X′mix輸入到用于捕獲低級(jí)別音頻特征的擴(kuò)張卷積層,得到語(yǔ)音分離模型的輸入特征Xinput; 步驟S3:語(yǔ)音分離,通過(guò)基于語(yǔ)音分離模型獲取頻譜掩膜,并將其與混合音頻的頻譜特征Xmix相乘,得到預(yù)測(cè)出的目標(biāo)說(shuō)話人的純凈音頻的頻譜;通過(guò)參考混合音頻的相位譜并結(jié)合短時(shí)傅里葉逆變換,得到預(yù)測(cè)出的目標(biāo)說(shuō)話人在時(shí)域上的純凈音頻; 所述步驟S1中獲取目標(biāo)說(shuō)話人的聲紋特征Xref具體為:將目標(biāo)說(shuō)話人的參考音頻輸入至聲紋特征提取器中,獲取目標(biāo)說(shuō)話人的梅爾頻率倒譜系數(shù)MFCCs,將其作為目標(biāo)說(shuō)話人的聲紋特征Xref,具體包括以下步驟: 步驟S11:同時(shí)對(duì)目標(biāo)說(shuō)話人的參考音頻和混合音頻進(jìn)行靜音段修剪; 步驟S12:對(duì)去除靜音段的參考音頻和去除靜音段的混合音頻進(jìn)行處理,以保證參考音頻的長(zhǎng)度與混合音頻的長(zhǎng)度一致; 步驟S13:從去除靜音段的參考音頻中提取梅爾頻率倒譜系數(shù)MFCCs,取前P維作為目標(biāo)說(shuō)話人的聲紋特征Xref; 所述語(yǔ)音模型獲取頻譜掩膜的過(guò)程具體為:使用深度聚類(lèi)模型DPCL基于輸入特征Xinput得到嵌入向量,采用K-Means算法對(duì)得到的嵌入向量進(jìn)行聚類(lèi)獲取頻譜掩膜。
如需購(gòu)買(mǎi)、轉(zhuǎn)讓、實(shí)施、許可或投資類(lèi)似專(zhuān)利技術(shù),可聯(lián)系本專(zhuān)利的申請(qǐng)人或?qū)@麢?quán)人同濟(jì)大學(xué),其通訊地址為:200092 上海市楊浦區(qū)四平路1239號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開(kāi)、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 西門(mén)子股份公司R·弗蘭克獲國(guó)家專(zhuān)利權(quán)
- 上海亞明照明有限公司張紹軍獲國(guó)家專(zhuān)利權(quán)
- 寧波華儀寧創(chuàng)智能科技有限公司聞路紅獲國(guó)家專(zhuān)利權(quán)
- 株式會(huì)社KT李培根獲國(guó)家專(zhuān)利權(quán)
- 耐克創(chuàng)新有限合伙公司H.博伊盧獲國(guó)家專(zhuān)利權(quán)
- 蘋(píng)果公司J·C·迪方佐獲國(guó)家專(zhuān)利權(quán)
- 中興通訊股份有限公司徐源源獲國(guó)家專(zhuān)利權(quán)
- 京東方科技集團(tuán)股份有限公司劉瀚文獲國(guó)家專(zhuān)利權(quán)
- 京東數(shù)字科技控股有限公司付立獲國(guó)家專(zhuān)利權(quán)
- 開(kāi)迪恩有限公司烏韋·沃爾默獲國(guó)家專(zhuān)利權(quán)


熱門(mén)推薦
- 珠海格力電器股份有限公司傅豪獲國(guó)家專(zhuān)利權(quán)
- 廣州恒眾車(chē)聯(lián)網(wǎng)智能電子技術(shù)有限公司杜志峰獲國(guó)家專(zhuān)利權(quán)
- 深圳森浦仕科技有限公司張顯會(huì)獲國(guó)家專(zhuān)利權(quán)
- LG電子株式會(huì)社金范埈獲國(guó)家專(zhuān)利權(quán)
- 北京大學(xué)馬思偉獲國(guó)家專(zhuān)利權(quán)
- 九號(hào)科技有限公司鄭德龍獲國(guó)家專(zhuān)利權(quán)
- 中石化石油工程技術(shù)服務(wù)有限公司任紅偉獲國(guó)家專(zhuān)利權(quán)
- 羅偉強(qiáng)獲國(guó)家專(zhuān)利權(quán)
- 博勢(shì)股份有限公司S·萊納獲國(guó)家專(zhuān)利權(quán)
- 波莫卡公司H·M·羅諾獲國(guó)家專(zhuān)利權(quán)