OPPO廣東移動通信有限公司謝永斌獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉OPPO廣東移動通信有限公司申請的專利語音合成模型的訓練方法、語音合成方法、裝置及終端獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116013243B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211634849.5,技術領域涉及:G10L13/02;該發明授權語音合成模型的訓練方法、語音合成方法、裝置及終端是由謝永斌;宋陽;陳昌儒設計研發完成,并于2022-12-19向國家知識產權局提交的專利申請。
本語音合成模型的訓練方法、語音合成方法、裝置及終端在說明書摘要公布了:一種語音合成模型的訓練方法、語音合成方法、裝置及終端,語音合成模型的訓練方法通過獲取第一訓練樣本數據;基于第一訓練樣本數據對語音合成模型進行預訓練,以對語音合成模型中包括的音頻處理模塊和文本編碼模塊的模型參數進行調整,得到預訓練后的語音合成模型;獲取第二訓練樣本數據;基于第二訓練樣本數據對音頻處理模塊的模型參數進行調整,得到訓練后的語音合成模型。方法可以提升針對目標對象的個性化語音合成任務的語音合成模型的模型效果,進而使得在采用語音合成模型進行語音合成時可以提升語音合成得到的語音的質量。
本發明授權語音合成模型的訓練方法、語音合成方法、裝置及終端在權利要求書中公布了:1.一種語音合成模型的訓練方法,其特征在于,所述方法包括: 獲取第一訓練樣本數據,所述第一訓練樣本數據包括多組第一訓練樣本數據對,每組第一訓練樣本數據對包括音頻對象編號信息、音頻數據以及對應的文本數據; 基于所述第一訓練樣本數據對語音合成模型進行預訓練,以對所述語音合成模型中包括的解耦的音頻處理模塊和文本編碼模塊的模型參數進行調整,得到預訓練后的語音合成模型; 獲取第二訓練樣本數據,所述第二訓練樣本數據包括多組第二訓練樣本數據對,每組第二訓練樣本數據對包括目標對象的目標編號信息、目標音頻數據以及對應的目標文本數據; 基于所述第二訓練樣本數據對所述音頻處理模塊的模型參數進行調整,得到訓練后的語音合成模型,其中,所述音頻處理模塊包括編號編碼器、音頻編碼器、雙向編碼器、時長預測器以及聲碼器,基于所述編號編碼器對所述目標編號信息進行編碼,得到目標編號特征;基于所述音頻編碼器對所述目標音頻數據進行編碼,得到目標音頻特征;將所述目標音頻特征與所述目標編號特征輸入至所述聲碼器中,得到輸出的預測目標音頻數據;將所述目標音頻特征輸入至所述雙向編碼器中,得到輸出的目標音頻編碼特征;基于預訓練后的文本編碼模塊對所述目標文本數據進行編碼,得到目標文本特征;將所述目標音頻編碼特征、所述目標編號特征以及所述目標文本特征輸入至所述時長預測器中進行對齊,得到目標對齊結果;基于所述目標音頻數據與所述預測目標音頻數據的差異以及所述目標對齊結果對所述音頻處理模塊包括的編號編碼器、音頻編碼器、雙向編碼器、時長預測器以及聲碼器中的模型參數進行更新,得到訓練后的語音合成模型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人OPPO廣東移動通信有限公司,其通訊地址為:523860 廣東省東莞市長安鎮烏沙海濱路18號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。