北京達佳互聯信息技術有限公司強春雨獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京達佳互聯信息技術有限公司申請的專利音頻編解碼器的訓練方法、音頻處理方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120356476B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510863785.3,技術領域涉及:G10L19/022;該發明授權音頻編解碼器的訓練方法、音頻處理方法及裝置是由強春雨;王小鵬;陳睿龍;梁宇哲;尹慷;張晨;張迪;蓋坤設計研發完成,并于2025-06-25向國家知識產權局提交的專利申請。
本音頻編解碼器的訓練方法、音頻處理方法及裝置在說明書摘要公布了:本公開關于一種音頻編解碼器的訓練方法、音頻處理方法及裝置。該方法包括:基于待訓練的預設音頻編解碼器對樣本音頻特征進行編解碼處理,得到樣本音頻編碼特征、樣本變分編碼特征以及潛在空間分布;并將樣本變分編碼特征輸入預設音頻解碼模型進行解碼處理,得到重建音頻特征;基于重建音頻特征和樣本音頻特征確定第一損失信息;確定潛在空間分布與標準高斯分布的散度距離大于預設散度閾值的情況下,基于散度距離和預設散度閾值得到散度損失信息;根據第一損失信息和散度損失信息對預設音頻編解碼器進行模型參數調整,直至滿足訓練迭代結束條件以得到訓練好的目標音頻編解碼器。可以避免散度損失的坍塌問題,以提升音頻表征的多樣性和保真度。
本發明授權音頻編解碼器的訓練方法、音頻處理方法及裝置在權利要求書中公布了:1.一種音頻編解碼器的訓練方法,其特征在于,待訓練的預設音頻編解碼器包括預設音頻編碼模型、預設變分自編碼器、預設音頻解碼模型;所述方法包括: 獲取當前訓練步數下的樣本音頻特征; 將所述樣本音頻特征輸入所述預設音頻編碼模型中進行音頻編碼處理得到的樣本音頻編碼特征,輸入所述預設變分自編碼器進行潛在空間分布預測以及特征采樣處理,得到樣本變分編碼特征以及潛在空間分布; 將所述樣本變分編碼特征輸入所述預設音頻解碼模型進行解碼處理,得到重建音頻特征;并基于所述重建音頻特征和所述樣本音頻特征,得到第一損失信息; 確定所述潛在空間分布與標準高斯分布的散度距離;并在所述散度距離大于預設散度閾值的情況下,基于所述散度距離和所述預設散度閾值,得到散度損失信息; 根據所述第一損失信息和所述散度損失信息,對所述預設音頻編解碼器進行模型參數調整; 在所述模型參數調整后,返回所述獲取當前訓練步數下的樣本音頻特征的步驟,直至滿足訓練迭代結束條件,將所述滿足訓練迭代結束條件時的所述預設音頻編解碼器作為目標音頻編解碼器。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京達佳互聯信息技術有限公司,其通訊地址為:100085 北京市海淀區西二旗西路16號院12號樓8層101;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。