三峽大學張萌萌獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉三峽大學申請的專利一種融合OMLSA和TQWT的光纖麥克風單通道語音增強方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119785808B 。
龍圖騰網通過國家知識產權局官網在2025-09-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411871991.0,技術領域涉及:G10L21/0208;該發明授權一種融合OMLSA和TQWT的光纖麥克風單通道語音增強方法是由張萌萌;冉昌艷;羅志會;劉冰倩;周琦;杜勇;張君強設計研發完成,并于2024-12-18向國家知識產權局提交的專利申請。
本一種融合OMLSA和TQWT的光纖麥克風單通道語音增強方法在說明書摘要公布了:一種融合OMLSA和TQWT的光纖麥克風單通道語音增強方法,對采集的語音信號首先進行分幀處理,對每一幀進行OMLSA語音增強,并使用分段信噪比為判決條件,決定是否需要進行TQWT去除殘留噪聲。利用重建誤差選擇TQWT分解所需參數Q因子和冗余量r的最佳值,保證對語音信號分解得到最適合的一組小波系數,并根據每個小波系數自適應選擇閾值,使用基追蹤對小波系數進行稀疏化,通過稀疏化的小波系數重構得到最終增強的語音信號。相較于只使用OMLSA進行去噪,本發明方法可在此基礎上進一步有效抑制殘余噪聲,提升了語音增強效果。
本發明授權一種融合OMLSA和TQWT的光纖麥克風單通道語音增強方法在權利要求書中公布了:1.一種融合OMLSA和TQWT的光纖麥克風單通道語音增強方法,其特征在于包括以下步驟: 步驟1:設光纖麥克風檢測的語音信號為yn,其中,n為采樣點索引,,N為總采樣點數; 步驟2:選擇漢寧窗對語音信號yn分幀,得到時域信號yn,l,其中,l為幀索引,,L為總幀數; 步驟3:利用離散傅里葉變換,將時域信號yn,l轉換為頻域信號Yk,l,其中,k為頻率索引,k=0,1,2,…,N-1; 步驟4:基于OMLSA算法對語音增強,增強后的頻譜幅值由以下公式計算: ; 其中:G min為語音不存在時的增益函數;pk,l為頻率k下第l幀語音存在的后驗概率;G H1k,l為頻率k下第l幀語音存在時的增益函數;表示頻率k下第l幀語音不存在時,對|Yk,l|施加增益G min來抑制噪聲,表示頻率k下第l幀語音存在時,對|Yk,l|施加增益G H1k,l強調語音成分,符號|?|表示取絕對值; 步驟5:對所有幀的增強信號頻譜幅值進行傅里葉反變換,并根據漢寧窗函數恢復得到經OMLSA算法增強后的語音信號x 1n; 步驟6:判斷語音信號x 1n的分段信噪比segSNR是否滿足如下條件: segSNR≥5dB; 若滿足,則跳過步驟7、步驟8、步驟9,此時x 1n為最終的增強語音信號xn,否則,進行步驟7; 步驟7:對x 1n進行TQWT分解得到J+1個小波系數w{j},其中,J為最佳總分解層數,j為層數索引,1≤j≤J+1; 步驟8:采用基追蹤對小波系數w{j}進行稀疏化,得到稀疏化的小波系數w 1{j}; 步驟9:對稀疏化的小波系數w 1{j}進行逆TQWT,得到最終的增強語音信號xn; 所述步驟5中,對所有幀的增強信號頻譜幅值進行傅里葉反變換,其計算公式為: ; 其中:為第l幀語音的時域信號,n 1第l幀時域信號的采樣點索引,,e為自然對數的底數,i 1為虛數單位; 并根據漢寧窗函數恢復得到經OMLSA算法增強后的語音信號x 1n,其具體步驟為: 對應用漢寧窗得到第l幀語音加窗后的時域信號: ; 其中:為漢寧窗公式,,cos為余弦三角函數;對按幀重疊相加得到x 1n,其計算公式為: ; 其中:漢寧窗重疊幀權重,其計算公式為: ; 所述步驟7中,對x 1nTQWT分解得到J+1個小波系數w{j},包括以下步驟: 步驟7.1:利用重建誤差E求品質因子Q的最佳值Q opt和冗余度r的最佳值r opt; 步驟7.2:對x 1n進行酉離散傅里葉變換,得到X 1k,其公式為: ; 其中:X_1k為x 1n的離散傅里葉變換,初始化j=1; 步驟7.3:計算第j層的低通子帶長度和高通子帶長度: ; ; 其中:“round”表示四舍五入取整操作,,; 步驟7.4:計算第j層低通的通帶長度、高通的通帶長度、過渡帶的長度: ; ; ; 步驟7.5:獲取第j層低通子帶序列和高通子帶序列; 步驟7.6:對進行酉離散傅里葉反變換,得到TQWT分解的第j個小波系數w{j}: ; 其中:uDFTinv表示酉離散傅里葉反變換,其與離散傅里葉反變換的關系為: ; 其中:w_inv{j}為的離散傅里葉反變換; 步驟7.7:判斷是否滿足如下循環進行條件: jJ; 若滿足,則j的值加1且重復步驟7.3~步驟7.6,否則進行步驟7.8; 步驟7.8:計算TQWT分解的第J+1個小波系數,表示第J層低通子帶序列;至此分解的J+1個小波系數已全部求出; 所述步驟9中,對w 1{j}進行逆TQWT,包括以下步驟: 步驟9.1:求第J+1個稀疏化小波系數w 1{J+1}的酉離散傅里葉變換為,其中,k_2為其頻率索引,0≤k_2≤,表示的長度;初始化j=J; 步驟9.2:計算稀疏化后第j層低通的通帶長度、高通的通帶長度、過渡帶的長度分別為: ; ; ; 其中:為第j個稀疏化小波系數w 1{j}酉離散傅里葉變換的長度,為第j+1個稀疏化小波系數w 1{j+1}酉離散傅里葉變換的長度; 步驟9.3:計算第j層重構信號,0≤k 1≤,k 1表示第j層重構信號的頻率索引;包括以下步驟: S9.3.1:對第j個稀疏化小波系數w 1{j}進行酉離散傅里葉變換為,k_1為其頻率索引,0≤k_1≤; S9.3.2:由第j+1層重構的信號求第j層稀疏化的低通子帶序列; ; 式中:表示第j層稀疏化的低通子帶序列的初始值,表示第j+1層重構信號的初始值; ; 式中:表示第j層稀疏化的低通子帶序列從頻率1到頻率的值,表示從頻率1到頻率的值; ; 式中:表示第j層稀疏化的低通子帶序列從頻率到頻率的值;表示從頻率+1到頻率+的值;表示依次對取值1到執行θ運算; ; 式中:表示第j層稀疏化的低通子帶序列從頻率到頻率的值; ; 式中:表示第j層稀疏化的低通子帶序列在頻率處的取值; ; 式中:表示表示第j層稀疏化的低通子帶序列從頻率到頻率的值; ; 式中:表示第j層稀疏化的低通子帶序列從頻率到頻率的值;表示從頻率到頻率的值, ; 式中:表示第j層稀疏化的低通子帶序列從頻率到頻率的值;表示從頻率到頻率的值; S9.3.3:求第j層稀疏化的高通子帶序列: ; 式中:表示第j層稀疏化的高通子帶序列的初始值; ; 式中:表示第j層稀疏化的高通子帶序列從頻率1到頻率的值; ; 式中:表示第j層稀疏化的高通子帶序列從頻率到頻率的值;表示對w 1{j}進行酉離散傅里葉變換為從頻率1到頻率的值;表示依次對取值到1執行θ運算; ; 式中:表示第j層稀疏化的高通子帶序列從頻率到頻率的值;表示從頻率到頻率的值; ; 式中:表示第j層稀疏化的高通子帶序列在頻率處的值;表示在處的值; ; 式中:表示第j層稀疏化的高通子帶序列從頻率到頻率的值;表示從頻率到頻率的值; ; 式中:表示第j層稀疏化的高通子帶序列從頻率到頻率的值;表示從頻率到頻率的值; ; 式中:表示第j層稀疏化的高通子帶序列從頻率到頻率的值; S9.3.4:此時第j層重構信號; 步驟9.4:判斷是否滿足如下循環進行條件: j1; 若滿足,則j的值減1且重復步驟9.2~步驟9.3,否則進行步驟9.5; 步驟9.5:對步驟9.4判斷循環結束后最終的重構信號進行酉離散傅里葉反變換,得到最終的增強語言信號xn,xn=uDFTinvY 1k。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人三峽大學,其通訊地址為:443002 湖北省宜昌市大學路8號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。