廣州趣丸網絡科技有限公司張強獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉廣州趣丸網絡科技有限公司申請的專利一種語音合成方法、裝置、設備和存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119600990B 。
龍圖騰網通過國家知識產權局官網在2025-08-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411784364.3,技術領域涉及:G10L13/08;該發明授權一種語音合成方法、裝置、設備和存儲介質是由張強;張順四設計研發完成,并于2024-12-06向國家知識產權局提交的專利申請。
本一種語音合成方法、裝置、設備和存儲介質在說明書摘要公布了:本申請公開一種語音合成方法、裝置、設備和存儲介質,通過獲取目標文本,進行拆分,得到各個子文本;分別對每一個子文本進行語義分析,以確定每一個子文本的各個目標語義向量;將每一個子文本的各個目標語義向量輸入至預先訓練的語音要素預測模型中,得到每一個子文本分別對應的各個目標語音要素向量;針對每一個子文本,利用該子文本的各個目標語義向量以及各個目標語音要素向量在預先建立的模板語音庫中匹配對應的目標模板語音;基于各個子文本、目標語義向量、目標語音要素向量以及每一個子文本對應的目標模板語音合成目標語音。本申請確定了多個可以豐富語音特征跟內容的向量,再去匹配模板語音,即可以得到真實生動的目標語音。
本發明授權一種語音合成方法、裝置、設備和存儲介質在權利要求書中公布了:1.一種語音合成方法,其特征在于,包括: 獲取目標文本,并將所述目標文本進行拆分,得到各個子文本; 分別對每一個所述子文本進行語義分析,以確定每一個所述子文本的各個目標語義向量; 將每一個所述子文本的各個目標語義向量輸入至預先訓練的語音要素預測模型中,得到每一個所述子文本分別對應的各個目標語音要素向量;所述語音要素預測模型是以文本樣本集的語義向量為訓練樣本,以所述文本樣本集中每一個文本樣本的各個語音要素為樣本標簽訓練得到; 針對每一個所述子文本,利用該子文本的各個目標語義向量以及各個目標語音要素向量在預先建立的模板語音庫中匹配對應的目標模板語音;包括:利用該子文本的各個目標語義向量在所述模板語音庫中篩選出對應的各個模板語音,作為各個第一模板語音;分別確定每一個所述第一模板語音所標記的各個語音要素標簽;將各個所述目標語音要素向量與每一個所述第一模板語音的各個語音要素標簽進行匹配,并計算匹配度;確定最高的匹配度是否為第一預設閾值;若是,則將匹配度為所述第一預設閾值的第一模板語音作為目標模板語音;若否,則判斷所述最高的匹配度所對應的第一模板語音的個數是否不少于2個;若所述最高的匹配度所對應的第一模板語音的個數不少于2個,則將所述最高的匹配度所對應的第一模板語音作為第二模板語音;從各個所述第二模板語音中確定目標模板語音; 基于各個所述子文本、目標語義向量、目標語音要素向量以及每一個所述子文本對應的目標模板語音合成目標語音。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廣州趣丸網絡科技有限公司,其通訊地址為:510630 廣東省廣州市天河區平云路163號之二1601室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。