北京中科凡語科技有限公司劉宇宸獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉北京中科凡語科技有限公司申請的專利基于特征遷移損失的語音翻譯裝置的訓(xùn)練方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN114139557B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-12發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202111339635.0,技術(shù)領(lǐng)域涉及:G06F40/58;該發(fā)明授權(quán)基于特征遷移損失的語音翻譯裝置的訓(xùn)練方法是由劉宇宸;周玉設(shè)計(jì)研發(fā)完成,并于2021-11-12向國家知識產(chǎn)權(quán)局提交的專利申請。
本基于特征遷移損失的語音翻譯裝置的訓(xùn)練方法在說明書摘要公布了:本公開提供了一種基于特征遷移損失的語音翻譯裝置的訓(xùn)練方法,包括:對語音翻譯裝置的語音識別模塊進(jìn)行語音序列與文本序列之間的對齊訓(xùn)練;對語音翻譯裝置的語義編碼器和解碼器進(jìn)行文本翻譯訓(xùn)練;對對齊訓(xùn)練之后的語音識別模塊、文本翻譯訓(xùn)練后的語義編碼器以及文本翻譯訓(xùn)練之后的解碼器進(jìn)行語音翻譯訓(xùn)練;基于文本翻譯訓(xùn)練中的語義編碼器生成的源語言文本序列的包含語義信息的表示及語音翻譯訓(xùn)練中的語義編碼器生成的源語言語音特征序列的包含語義信息的表示,構(gòu)建特征遷移損失函數(shù);基于特征遷移損失函數(shù),最小化特征遷移損失,以獲得語音翻譯裝置。本公開還提供了一種語音翻譯裝置、電子設(shè)備以及可讀存儲介質(zhì)。
本發(fā)明授權(quán)基于特征遷移損失的語音翻譯裝置的訓(xùn)練方法在權(quán)利要求書中公布了:1.一種基于特征遷移損失的語音翻譯裝置的訓(xùn)練方法,其特征在于,包括: S102、基于包括源語言語音特征序列-源語言文本序列-目標(biāo)語言文本序列的數(shù)據(jù)集對語音翻譯裝置的語音識別模塊進(jìn)行語音序列與文本序列之間的對齊訓(xùn)練,獲得對齊訓(xùn)練之后的語音識別模塊; S104、基于所述包括源語言語音特征序列-源語言文本序列-目標(biāo)語言文本序列的數(shù)據(jù)集對語音翻譯裝置的語義編碼器和解碼器進(jìn)行文本翻譯訓(xùn)練,以獲得文本翻譯訓(xùn)練之后的語義編碼器和解碼器; S106、基于所述包括源語言語音特征序列-源語言文本序列-目標(biāo)語言文本序列的數(shù)據(jù)集對所述對齊訓(xùn)練之后的語音識別模塊、所述文本翻譯訓(xùn)練后的語義編碼器以及文本翻譯訓(xùn)練之后的解碼器進(jìn)行語音翻譯訓(xùn)練,以獲得語音翻譯訓(xùn)練之后的語音識別模塊、語義解碼器以及解碼器; S108、基于所述文本翻譯訓(xùn)練中的所述語義編碼器生成的源語言文本序列的包含語義信息的表示及所述語音翻譯訓(xùn)練中的所述語義編碼器生成的源語言語音特征序列的包含語義信息的表示,構(gòu)建特征遷移損失函數(shù);以及 S110、基于所述特征遷移損失函數(shù),最小化特征遷移損失,以獲得所述語音翻譯裝置。 S102中,基于包括源語言語音特征序列-源語言文本序列-目標(biāo)語言文本序列的數(shù)據(jù)集對語音翻譯裝置的語音識別模塊進(jìn)行語音特征序列與文本序列之間的對齊訓(xùn)練,包括: 所述語音識別模塊基于所述數(shù)據(jù)集中的源語言語音特征序列生成多個源語言文本預(yù)測序列,基于所述多個源語言文本預(yù)測序列以及所述數(shù)據(jù)集中的相應(yīng)的源語言文本序列進(jìn)行所述對齊訓(xùn)練; 所述語音識別模塊包括多頭注意力網(wǎng)絡(luò)、前饋神經(jīng)網(wǎng)絡(luò)以及softmax函數(shù)模塊,所述源語言語音特征序列作為所述多頭注意力網(wǎng)絡(luò)的輸入,所述多頭注意力網(wǎng)絡(luò)的輸出作為所述前饋神經(jīng)網(wǎng)絡(luò)的輸入,所述前饋神經(jīng)網(wǎng)絡(luò)的輸出作為所述softmax函數(shù)模塊的輸入,所述softmax函數(shù)模塊輸出所述多個源語言文本預(yù)測序列; 所述語音識別模塊還包括CTC損失函數(shù)模塊,所述CTC損失函數(shù)模塊基于各個所述源語言文本預(yù)測序列的預(yù)測概率之和構(gòu)建CTC損失函數(shù),最小化CTC損失以結(jié)束所述對齊訓(xùn)練; S104、基于包括源語言語音特征序列-源語言文本序列-目標(biāo)語言文本序列的數(shù)據(jù)集對語音翻譯裝置的語義編碼器和解碼器進(jìn)行文本翻譯訓(xùn)練,以獲得文本翻譯訓(xùn)練之后的語義編碼器和解碼器,包括: 構(gòu)建文本翻譯任務(wù)的目標(biāo)函數(shù),最小化所述文本翻譯任務(wù)的目標(biāo)函數(shù)的最大似然損失,以結(jié)束對語義編碼器和解碼器的文本翻譯訓(xùn)練;其中,文本翻譯任務(wù)的目標(biāo)函數(shù)表達(dá) 為:其中,x表示源語言文本序列,y表示目標(biāo)語言文本序列,DST表示數(shù)據(jù)集。 S106中,基于所述包括源語言語音特征序列-源語言文本序列-目標(biāo)語言文本序列的數(shù)據(jù)集對所述對齊訓(xùn)練之后的語音識別模塊、所述文本翻譯訓(xùn)練后的語義編碼器以及文本翻譯訓(xùn)練之后的解碼器進(jìn)行語音翻譯訓(xùn)練,包括: 構(gòu)建語音翻譯任務(wù)的目標(biāo)函數(shù),最小化所述語音翻譯任務(wù)的目標(biāo)函數(shù)的最大似然損失,以結(jié)束對語音識別模塊、語義編碼器及解碼器的語音翻譯訓(xùn)練;其中,語音翻譯任務(wù)的目標(biāo)函數(shù)表達(dá)為: 其中,s表示源語言語音特征序列,y表示目標(biāo)語言文本序列,DST表示數(shù)據(jù)集。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人北京中科凡語科技有限公司,其通訊地址為:100190 北京市海淀區(qū)知春路63號51號樓10層1006;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。


熱門推薦
- 美光科技公司張揚(yáng)獲國家專利權(quán)
- II-VI有限公司W(wǎng)-Q·許獲國家專利權(quán)
- 泉州市良發(fā)新能源科技有限公司楊良發(fā)獲國家專利權(quán)
- 塞壩股份公司M·巴赫曼獲國家專利權(quán)
- 英特爾公司G·A·格拉斯獲國家專利權(quán)
- 根馬布私人有限公司F.貝烏爾肯斯獲國家專利權(quán)
- 索尼半導(dǎo)體解決方案公司星野和弘獲國家專利權(quán)
- 愛德華茲生命科學(xué)公司D·S·帕特爾獲國家專利權(quán)
- W.L.戈?duì)柤巴使煞萦邢薰維·澤羅獲國家專利權(quán)
- 米迪繆尼有限公司R·卡卡獲國家專利權(quán)