中電信人工智能科技(北京)有限公司何佳旭獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉中電信人工智能科技(北京)有限公司申請的專利一種語音合成方法、裝置、設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119649797B 。
龍圖騰網通過國家知識產權局官網在2025-09-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411999489.8,技術領域涉及:G10L13/08;該發明授權一種語音合成方法、裝置、設備及存儲介質是由何佳旭;廉潔;李杰設計研發完成,并于2024-12-31向國家知識產權局提交的專利申請。
本一種語音合成方法、裝置、設備及存儲介質在說明書摘要公布了:本申請實施例涉及數據處理技術領域,具體而言,涉及一種語音合成方法、裝置、設備及存儲介質,旨在提升語音合成的表現力。所述方法包括:接收目標文本;從所述目標文本中獲取對應的文本特征,所述文本特征中包含有音素信息、詞邊界信息以及句子信息;將所述文本特征輸入預訓練的語義模型中,得到所述文本特征對應的音素級別的語義特征;對所述語義特征進行多層級表征融合,得到多層級語義特征;對所述多層級語義特征進行單詞與持續時間的對齊,以及,通過多頭注意力機制對所述多層級語義特征進行音素與持續時間的對齊,得到對齊處理后的所述多層級語義特征;根據對齊處理后的所述多層級語義特征,得到所述目標文本對應的語音。
本發明授權一種語音合成方法、裝置、設備及存儲介質在權利要求書中公布了:1.一種語音合成方法,其特征在于,所述方法包括: 接收目標文本; 從所述目標文本中獲取對應的文本特征,所述文本特征中包含有音素信息、詞邊界信息以及句子信息; 將所述文本特征輸入預訓練的語義模型中,得到所述文本特征對應的音素級別的語義特征; 對所述語義特征進行多層級表征融合,得到多層級語義特征; 對所述多層級語義特征進行單詞與持續時間的對齊,以及,通過多頭注意力機制對所述多層級語義特征進行音素與持續時間的對齊,得到對齊處理后的所述多層級語義特征; 根據對齊處理后的所述多層級語義特征,得到所述目標文本對應的語音; 其中,對所述語義特征進行多層級表征融合,得到多層級語義特征,包括: 從所述語義特征中提取出對應的句子特征; 將所述句子特征與所述語義特征中包括的音素特征以及詞特征進行融合,得到所述多層級語義特征。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中電信人工智能科技(北京)有限公司,其通訊地址為:100034 北京市西城區西四北大街156、158、160號2幢1至2層2-6、2-9內01;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。