科大訊飛股份有限公司尤祖寰獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉科大訊飛股份有限公司申請的專利一種語音識(shí)別方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN114333778B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-05發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號(hào)為:202111661788.7,技術(shù)領(lǐng)域涉及:G10L15/02;該發(fā)明授權(quán)一種語音識(shí)別方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備是由尤祖寰;劉聰設(shè)計(jì)研發(fā)完成,并于2021-12-30向國家知識(shí)產(chǎn)權(quán)局提交的專利申請。
本一種語音識(shí)別方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備在說明書摘要公布了:本申請公開了一種語音識(shí)別方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備,該方法包括:首先獲取待識(shí)別的目標(biāo)語音,然后再將目標(biāo)語音輸入至預(yù)先構(gòu)建的語音識(shí)別模型,識(shí)別得到目標(biāo)語音對(duì)應(yīng)的字符概率分布;其中,語音識(shí)別模型是在基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)模型基礎(chǔ)上,結(jié)合RnnT損失約束函數(shù)訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)模型;接著可以根據(jù)目標(biāo)語音對(duì)應(yīng)的字符概率分布,對(duì)目標(biāo)語音進(jìn)行識(shí)別,得到目標(biāo)語音的識(shí)別結(jié)果。由于本申請中預(yù)先構(gòu)建的語音識(shí)別模型是在基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)模型基礎(chǔ)上,結(jié)合RnnT損失約束函數(shù)訓(xùn)練得到的,從而能夠在模型訓(xùn)練時(shí),利用RnnT損失約束函數(shù)顯式地對(duì)輸入特征和輸出字符之間做對(duì)齊約束,進(jìn)而提升了模型的泛化能力,也提升了語音識(shí)別效果和準(zhǔn)確率。
本發(fā)明授權(quán)一種語音識(shí)別方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備在權(quán)利要求書中公布了:1.一種語音識(shí)別方法,其特征在于,包括: 獲取待識(shí)別的目標(biāo)語音; 將所述目標(biāo)語音輸入至預(yù)先構(gòu)建的語音識(shí)別模型,識(shí)別得到所述目標(biāo)語音對(duì)應(yīng)的字符概率分布;所述語音識(shí)別模型是在基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)模型基礎(chǔ)上,結(jié)合遞歸神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換器RnnT損失約束函數(shù)訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)模型;所述語音識(shí)別模型包括輸入層、編碼器層、分類層、注意力機(jī)制層、仿聯(lián)合網(wǎng)絡(luò)層、輸出層; 根據(jù)所述目標(biāo)語音對(duì)應(yīng)的字符概率分布,對(duì)所述目標(biāo)語音進(jìn)行識(shí)別,得到所述目標(biāo)語音的識(shí)別結(jié)果; 所述將所述目標(biāo)語音輸入至預(yù)先構(gòu)建的語音識(shí)別模型,識(shí)別得到所述目標(biāo)語音對(duì)應(yīng)的字符概率分布,包括: 將所述目標(biāo)語音的聲學(xué)特征通過所述輸入層輸入所述編碼器層,得到編碼特征; 將所述編碼特征輸入所述分類層,得到所述目標(biāo)語音中每個(gè)語音幀對(duì)應(yīng)的字符初始概率分布; 將所述編碼特征輸入所述注意力機(jī)制層,得到所述目標(biāo)語音中每個(gè)語音幀的注意力系數(shù); 將所述目標(biāo)語音中每個(gè)語音幀對(duì)應(yīng)的字符初始概率分布和注意力系數(shù)輸入所述仿聯(lián)合網(wǎng)絡(luò)層,得到所述目標(biāo)語音中每個(gè)語音幀對(duì)應(yīng)的字符中間概率分布;并將所述字符中間概率分布與一維空字符的概率進(jìn)行拼接,得到更新后的中間概率分布; 利用所述RnnT損失約束函數(shù),對(duì)所述更新后的中間概率分布進(jìn)行約束,得到所述目標(biāo)語音中每個(gè)語音幀對(duì)應(yīng)的字符的最終概率分布。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人科大訊飛股份有限公司,其通訊地址為:230088 安徽省合肥市高新區(qū)望江西路666號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。


熱門推薦
- 文塔納醫(yī)療系統(tǒng)公司M.巴恩斯獲國家專利權(quán)
- 廣州極飛科技股份有限公司溫海軍獲國家專利權(quán)
- 德雷塞爾大學(xué)蒂莫西·M·布勒克獲國家專利權(quán)
- 松下電器研究開發(fā)(蘇州)有限公司牛向偉獲國家專利權(quán)
- 微軟技術(shù)許可有限責(zé)任公司M·A·馬林獲國家專利權(quán)
- LG 電子株式會(huì)社姜智源獲國家專利權(quán)
- 英特爾公司T·T·施呂斯列爾獲國家專利權(quán)
- 八樂夢床業(yè)株式會(huì)社細(xì)川雄史獲國家專利權(quán)
- 賽銳貝尓股份有限公司約瑟夫·帕維茲獲國家專利權(quán)
- 開易(廣東)服裝配件有限公司陳昌華獲國家專利權(quán)