中國(guó)傳媒大學(xué)孟明獲國(guó)家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉中國(guó)傳媒大學(xué)申請(qǐng)的專利基于動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)和特征調(diào)制的零樣本語(yǔ)音克隆方法獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN119360821B 。
龍圖騰網(wǎng)通過(guò)國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-08-29發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202411631072.6,技術(shù)領(lǐng)域涉及:G10L13/02;該發(fā)明授權(quán)基于動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)和特征調(diào)制的零樣本語(yǔ)音克隆方法是由孟明;楊紫伊;蘇鎮(zhèn)杰;侯小萍;郝君怡;范肇心;朱永貴設(shè)計(jì)研發(fā)完成,并于2024-11-15向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本基于動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)和特征調(diào)制的零樣本語(yǔ)音克隆方法在說(shuō)明書摘要公布了:本發(fā)明公開(kāi)了基于動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)和特征調(diào)制的零樣本語(yǔ)音克隆方法,所述方法包括說(shuō)話人風(fēng)格編碼器從參考音頻中提取說(shuō)話人風(fēng)格向量;基于SGF算法對(duì)說(shuō)話人風(fēng)格向量進(jìn)行特征調(diào)制,將調(diào)制后的說(shuō)話人風(fēng)格向量輸入生成器;所述生成器基于動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)合成目標(biāo)說(shuō)話人音頻。所述方法能夠在零樣本情境下對(duì)任一說(shuō)話人的音頻進(jìn)行克隆,合成流暢自然、相似度高的目標(biāo)音頻。
本發(fā)明授權(quán)基于動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)和特征調(diào)制的零樣本語(yǔ)音克隆方法在權(quán)利要求書中公布了:1.一種基于動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)和特征調(diào)制的零樣本語(yǔ)音克隆方法,其特征在于,所述方法包括如下步驟: 說(shuō)話人風(fēng)格編碼器從參考音頻中提取說(shuō)話人風(fēng)格向量; 基于SGF算法對(duì)說(shuō)話人風(fēng)格向量進(jìn)行特征調(diào)制,包括: 設(shè)表示音素序列特征向量,其中表示音素序列特征向量的維度,對(duì)音素序列特征向量進(jìn)行標(biāo)準(zhǔn)化: , , , 式中,表示標(biāo)準(zhǔn)化后的特征向量,表示特征向量的均值,表示特征向量的方差,表示特征向量索引,是特征向量的維度; 通過(guò)四個(gè)參數(shù)對(duì)最終的風(fēng)格向量進(jìn)行調(diào)制: , , 式中,w表示風(fēng)格向量,表示通過(guò)雙曲正切函數(shù)處理最終的風(fēng)格向量得到的第一縮放因子;表示通過(guò)雙曲正切函數(shù)處理最終的風(fēng)格向量得到的偏置因子;表示通過(guò)雙曲正切函數(shù)處理最終的風(fēng)格向量得到的基準(zhǔn)特征,用于平衡和;表示通過(guò)Sigmoid函數(shù)處理最終的風(fēng)格向量得到的動(dòng)態(tài)調(diào)節(jié)因子; 通過(guò)加權(quán)操作將四個(gè)參數(shù)應(yīng)用于標(biāo)準(zhǔn)化的特征向量: , , , 式中,表示融合風(fēng)格向量后的特征序列; 將調(diào)制后的說(shuō)話人風(fēng)格向量輸入生成器;所述生成器基于動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)合成目標(biāo)說(shuō)話人音頻,其中動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)根據(jù)音素序列長(zhǎng)度選擇預(yù)測(cè)器架構(gòu):長(zhǎng)音素序列采用帶線性層的預(yù)測(cè)器;短音素序列采用帶一維卷積層的預(yù)測(cè)器。
如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人中國(guó)傳媒大學(xué),其通訊地址為:100024 北京市朝陽(yáng)區(qū)定福莊東街1號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開(kāi)、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 中國(guó)電力科學(xué)研究院有限公司唐艷梅獲國(guó)家專利權(quán)
- 施耐德電氣日本控股有限公司慶家蔵獲國(guó)家專利權(quán)
- 聯(lián)想(北京)有限公司張鵬獲國(guó)家專利權(quán)
- 奧克斯能源有限公司拉賈克什米·普卡雅斯塔獲國(guó)家專利權(quán)
- 昕諾飛控股有限公司A·A·阿博獲國(guó)家專利權(quán)
- 自然資源實(shí)物地質(zhì)資料中心蘇桂芬獲國(guó)家專利權(quán)
- 上海大創(chuàng)汽車技術(shù)有限公司趙明獲國(guó)家專利權(quán)
- 維薩國(guó)際服務(wù)協(xié)會(huì)G·韋爾斯特拉滕獲國(guó)家專利權(quán)
- 索尼半導(dǎo)體解決方案公司五十嵐信之獲國(guó)家專利權(quán)
- 吉成無(wú)線(深圳)有限公司謝文卉獲國(guó)家專利權(quán)


熱門推薦
- 三星顯示有限公司都永洛獲國(guó)家專利權(quán)
- 株式會(huì)社NTT都科摩松村祐輝獲國(guó)家專利權(quán)
- 昊佰電子科技(上海)有限公司蔣建國(guó)獲國(guó)家專利權(quán)
- 興鋒閥門有限公司盧禮生獲國(guó)家專利權(quán)
- 寧波華儀寧創(chuàng)智能科技有限公司聞路紅獲國(guó)家專利權(quán)
- 北京大學(xué)馬思偉獲國(guó)家專利權(quán)
- 浙江舜宇光學(xué)有限公司高雪獲國(guó)家專利權(quán)
- 余姚市亞?wèn)|塑業(yè)有限公司胡繼宗獲國(guó)家專利權(quán)
- 羅偉強(qiáng)獲國(guó)家專利權(quán)
- 京東方科技集團(tuán)股份有限公司劉瀚文獲國(guó)家專利權(quán)