騰訊美國有限責任公司盧恒獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉騰訊美國有限責任公司申請的專利一種根據(jù)輸入生成語音和視頻信息的方法、設(shè)備、裝置和介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN114041183B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-22發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202080030508.X,技術(shù)領(lǐng)域涉及:G10L13/08;該發(fā)明授權(quán)一種根據(jù)輸入生成語音和視頻信息的方法、設(shè)備、裝置和介質(zhì)是由盧恒;俞承柱;俞棟設(shè)計研發(fā)完成,并于2020-08-06向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種根據(jù)輸入生成語音和視頻信息的方法、設(shè)備、裝置和介質(zhì)在說明書摘要公布了:一種根據(jù)輸入生成語音和視頻信息的方法、設(shè)備、裝置和介質(zhì),包括接收包括文本構(gòu)成要素序列的文本輸入。使用持續(xù)時間模型確定文本構(gòu)成要素的各個時間性持續(xù)時間。基于持續(xù)時間模型生成頻譜圖幀。基于頻譜圖幀生成音頻波形。基于音頻波形生成視頻信息。音頻波形與對應(yīng)視頻一起被提供作為輸出。
本發(fā)明授權(quán)一種根據(jù)輸入生成語音和視頻信息的方法、設(shè)備、裝置和介質(zhì)在權(quán)利要求書中公布了:1.一種根據(jù)輸入生成語音和視頻信息的方法,其特征在于,所述方法包括: 由設(shè)備接收包括文本構(gòu)成要素序列的文本輸入,所述文本構(gòu)成要素為字符; 由所述設(shè)備并使用持續(xù)時間模型來確定所述文本構(gòu)成要素的各個時間性持續(xù)時間; 由所述設(shè)備基于所述文本構(gòu)成要素序列生成第一頻譜組; 由所述設(shè)備基于所述第一頻譜組和所述文本構(gòu)成要素序列的所述各個時間性持續(xù)時間生成第二頻譜組,所述第二頻譜組為基于對應(yīng)于頻譜的基本文本構(gòu)成要素的各個時間性持續(xù)時間通過復(fù)制第一頻譜組中的各個頻譜生成的; 由所述設(shè)備基于所述第二頻譜組生成頻譜圖幀; 由所述設(shè)備基于所述頻譜圖幀生成音頻波形; 由所述設(shè)備生成與所述音頻波形相對應(yīng)的視頻信息;以及 由所述設(shè)備基于所述視頻信息提供所述音頻波形和對應(yīng)視頻作為所述設(shè)備的輸出; 其中,所述文本輸入通過以下獲得: 接收包括對應(yīng)輸入音頻波形的輸入視頻作為輸入; 由所述設(shè)備生成與所述輸入音頻波形相對應(yīng)的輸入視頻信息; 由所述設(shè)備基于所述輸入音頻波形生成輸入頻譜圖幀; 由所述設(shè)備基于所述輸入頻譜圖幀生成第一輸入頻譜組; 由所述設(shè)備基于所述第一輸入頻譜組生成第二輸入頻譜組;以及 由所述設(shè)備并使用所述持續(xù)時間模型確定所述文本輸入。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人騰訊美國有限責任公司,其通訊地址為:美國加利福尼亞州帕洛阿爾托公園大道2747號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。