蘇州奇夢者科技有限公司李志獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉蘇州奇夢者科技有限公司申請的專利基于麥克風(fēng)陣列的多目標(biāo)神經(jīng)網(wǎng)絡(luò)語音處理方法及裝置獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN114708880B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-19發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202210451728.0,技術(shù)領(lǐng)域涉及:G10L21/0208;該發(fā)明授權(quán)基于麥克風(fēng)陣列的多目標(biāo)神經(jīng)網(wǎng)絡(luò)語音處理方法及裝置是由李志;李霄;丘四海;王歡良;張李設(shè)計研發(fā)完成,并于2022-04-24向國家知識產(chǎn)權(quán)局提交的專利申請。
本基于麥克風(fēng)陣列的多目標(biāo)神經(jīng)網(wǎng)絡(luò)語音處理方法及裝置在說明書摘要公布了:本發(fā)明公開了一種基于麥克風(fēng)陣列的多目標(biāo)神經(jīng)網(wǎng)絡(luò)語音處理方法及裝置,該方法將多通道錄音數(shù)據(jù)和多通道回采數(shù)據(jù)輸入RLS濾波器進行多通道線性回聲消除,再采用濾波器的誤差信號和估計回聲信號的頻域相關(guān)度來計算每個頻點的殘余回聲能量;將誤差信號和估計的殘余回聲信號聲學(xué)特征輸入殘差神經(jīng)網(wǎng)絡(luò),且多目標(biāo)遞進,使殘差神經(jīng)網(wǎng)絡(luò)能夠在較小的網(wǎng)絡(luò)結(jié)構(gòu)中快速的收斂;后置的降噪、去回聲、去混響算法使用多通道維納濾波器配合mask統(tǒng)一計算,這樣復(fù)雜度低,且避免了單個算法依次處理過程中的語音損失。從而實現(xiàn)了讓語音降噪、去回聲、去混響的目標(biāo)融合在一起,具有計算復(fù)雜度低,延時低實時性好,且語音質(zhì)量高的特點,符合實際的使用需求。
本發(fā)明授權(quán)基于麥克風(fēng)陣列的多目標(biāo)神經(jīng)網(wǎng)絡(luò)語音處理方法及裝置在權(quán)利要求書中公布了:1.一種基于麥克風(fēng)陣列的多目標(biāo)神經(jīng)網(wǎng)絡(luò)語音處理方法,其特征在于,包括: 步驟100、使用短時傅立葉變換獲取多通道錄音的頻域數(shù)據(jù)和多路立體聲回采的頻域數(shù)據(jù);步驟200、將多通道錄音的頻域數(shù)據(jù)與多路立體聲回采的頻域數(shù)據(jù)送入RLS濾波器中得到誤差信號和回聲估計信號,計算二者的頻域相關(guān)度作為回聲信號的泄漏系數(shù),再乘以誤差信號得到估計的各頻點的殘余回聲信號; 步驟300、提取誤差信號和殘余回聲信號的BFCC特征輸入多目標(biāo)神經(jīng)網(wǎng)絡(luò),獲取融合的降噪、去回聲、去混響的語音能量掩碼; 步驟400、將語音能量掩碼通過波束形成濾波器濾波后,反變換到時域,得到干凈的時域音頻,所述波束形成濾波器為多通道維納濾波; 所述步驟200中,RLS線性濾波器的輸出為; Lstyn,f=WHn-1,fXn,f; En,f=Y(jié)n,f-Lstyn,f; Wn,f=Wn-1,f+kn,fEHn,f; kn,f=Pn-1,fXn,f1+XHn,fPn-1,fXn,f; 其中,X為多通道回采數(shù)據(jù)的頻域組成的向量;W是RLS濾波器向量;E是誤差信號;Lsty是回聲估計信號;Y是近端語音信號;R是回采各頻點上的協(xié)方差矩陣;P是R的逆矩陣;k是濾波器W的更新系數(shù);n是幀數(shù);f是頻率點; 步驟400中的所述波束形成濾波器采用如下公式計算: Hf=Rssf+u*Rnnf-1Rssfe1; Rssn,f=λ*Rssn-1,f+1-λ*maskn,fXn,fXHn,fmaskHn,f; 其中,H是波束形成濾波器的系數(shù);Rss是估計目標(biāo)語音的協(xié)方差矩陣;Rnn是估計非目標(biāo)信號的協(xié)方差矩陣;u是語音保真度系數(shù),范圍是0-1;e1是向量1;0;...;0;λ是協(xié)方差矩陣更新系數(shù),范圍是0-1;mask是神經(jīng)網(wǎng)絡(luò)估計的目標(biāo)語音的掩蔽系數(shù);X是原始的錄音數(shù)據(jù)信號;n是幀數(shù);f是頻率點; 各個頻點的語音及噪聲協(xié)方差矩陣采用學(xué)習(xí)率不斷迭代的方式進行計算,并實時計算更新波束形成濾波器。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人蘇州奇夢者科技有限公司,其通訊地址為:215024 江蘇省蘇州市工業(yè)園區(qū)若水路388號E1905;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。


熱門推薦
- 歌爾科技有限公司蔡曉東獲國家專利權(quán)
- 浙江舜宇光學(xué)有限公司楊萌獲國家專利權(quán)
- 廣東美的制冷設(shè)備有限公司閆長林獲國家專利權(quán)
- 松下知識產(chǎn)權(quán)經(jīng)營株式會社松下瞬平獲國家專利權(quán)
- 高準(zhǔn)有限公司安德魯·S·克拉維茨獲國家專利權(quán)
- 三星麥迪森株式會社樸兌振獲國家專利權(quán)
- 德克薩斯儀器股份有限公司G·F·查爾德獲國家專利權(quán)
- 法雷奧熱系統(tǒng)公司J.貝努阿利獲國家專利權(quán)
- 廣東美的制冷設(shè)備有限公司翟富興獲國家專利權(quán)
- 三花控股集團有限公司請求不公布姓名獲國家專利權(quán)