北京生數(shù)科技有限公司請求不公布姓名獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉北京生數(shù)科技有限公司申請的專利音頻生成的方法、裝置、存儲介質(zhì)、電子設備和程序產(chǎn)品獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN120340507B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-09-02發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202510821684.X,技術領域涉及:G10L19/008;該發(fā)明授權音頻生成的方法、裝置、存儲介質(zhì)、電子設備和程序產(chǎn)品是由請求不公布姓名設計研發(fā)完成,并于2025-06-19向國家知識產(chǎn)權局提交的專利申請。
本音頻生成的方法、裝置、存儲介質(zhì)、電子設備和程序產(chǎn)品在說明書摘要公布了:本公開實施例公開了一種音頻生成的方法、裝置、存儲介質(zhì)、電子設備和程序產(chǎn)品,將獲取的音頻生成任務的引導信息進行編碼,得到所述引導信息的隱空間表達;基于擴散模型,利用混合引導策略和所述引導信息的隱空間表達,逐步進行去噪迭代,得到目標數(shù)據(jù);其中,所述擴散模型包括原模型和降級模型,所述混合引導策略用于引導所述原模型和所述降級模型分別進行無分類器引導;將所述目標數(shù)據(jù)解碼至音頻空間,得到所述音頻生成任務對應的音頻信息。本公開通過引導原模型和降級模型分別進行無分類器引導和降級模型引導的混合引導策略使得引導路徑更具結構性和魯棒性,有效提升了語義保真度和音頻信號的自然度。
本發(fā)明授權音頻生成的方法、裝置、存儲介質(zhì)、電子設備和程序產(chǎn)品在權利要求書中公布了:1.一種音頻生成的方法,其特征在于,包括: 將獲取的音頻生成任務的引導信息進行編碼,得到所述引導信息的隱空間表達; 基于擴散模型,利用混合引導策略和所述引導信息的隱空間表達,逐步進行去噪迭代,得到目標數(shù)據(jù);其中,所述擴散模型包括原模型和降級模型,所述混合引導策略用于引導所述原模型和所述降級模型分別進行無分類器引導,所述原模型為訓練完備的主擴散模型,所述降級模型為相對于所述原模型的訓練不充分的模型; 將所述目標數(shù)據(jù)解碼至音頻空間,得到所述音頻生成任務對應的音頻信息。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或?qū)@麢嗳?a target="_blank" rel="noopener noreferrer nofollow" href="https://iptop.www.hzsmkbearing.com.cn/list?keyword=%E5%8C%97%E4%BA%AC%E7%94%9F%E6%95%B0%E7%A7%91%E6%8A%80%E6%9C%89%E9%99%90%E5%85%AC%E5%8F%B8&temp=1">北京生數(shù)科技有限公司,其通訊地址為:100086 北京市海淀區(qū)中關村東路8號東升大廈AB座八層801A單元;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。