中國電子科技集團(tuán)公司第二十八研究所湯聞易獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉中國電子科技集團(tuán)公司第二十八研究所申請的專利一種基于語速感知的空管語音識別模型的語音識別方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN120510850B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-26發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202511021857.6,技術(shù)領(lǐng)域涉及:G10L15/26;該發(fā)明授權(quán)一種基于語速感知的空管語音識別模型的語音識別方法是由湯聞易;席玉華;劉澤原;徐秋程;蔣偉煜;丁一波;丁輝;黃吉波;徐珂;張陽;張明偉設(shè)計(jì)研發(fā)完成,并于2025-07-24向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種基于語速感知的空管語音識別模型的語音識別方法在說明書摘要公布了:本發(fā)明公開了一種基于語速感知的空管語音識別模型的語音識別方法,包括:步驟1:統(tǒng)計(jì)空管語音的正常語速區(qū)間;步驟2:構(gòu)建包含所述語速估計(jì)層的空管語音識別模型;步驟3:定義聯(lián)合損失函數(shù),訓(xùn)練空管語音識別模型,并在訓(xùn)練過程中動態(tài)調(diào)整所述聯(lián)合損失函數(shù)中CTC損失權(quán)重系數(shù)和語速感知損失權(quán)重系數(shù);步驟4:使用訓(xùn)練后的語音識別模型對空管語音數(shù)據(jù)進(jìn)行識別。本發(fā)明引入語速感知損失約束形成結(jié)合語音識別主任務(wù)與語速規(guī)律學(xué)習(xí)輔助任務(wù)的多任務(wù)學(xué)習(xí)機(jī)制,顯著提升了空管陸空通話語音識別模型在復(fù)雜環(huán)境下的魯棒性和識別準(zhǔn)確率,為空管安全高效運(yùn)行提供更可靠的技術(shù)支撐。
本發(fā)明授權(quán)一種基于語速感知的空管語音識別模型的語音識別方法在權(quán)利要求書中公布了:1.一種基于語速感知的空管語音識別模型的語音識別方法,其特征在于,包括如下步驟: 步驟1:統(tǒng)計(jì)空管語音的正常語速區(qū)間; 步驟2:構(gòu)建包含語速估計(jì)層的空管語音識別模型; 步驟3:定義聯(lián)合損失函數(shù),訓(xùn)練空管語音識別模型,并在訓(xùn)練過程中動態(tài)調(diào)整所述聯(lián)合損失函數(shù)中CTC損失權(quán)重系數(shù)和語速感知損失權(quán)重系數(shù); 步驟4:使用訓(xùn)練后的空管語音識別模型對空管語音進(jìn)行識別; 步驟1中所述的統(tǒng)計(jì)空管語音的正常語速區(qū)間,具體包括: 步驟1-1:定義中英文語速統(tǒng)計(jì)算法,對中文陸空通話語音,統(tǒng)計(jì)單位時間內(nèi)識別文本的字符數(shù)量作為語速指標(biāo);對英文陸空通話語音,統(tǒng)計(jì)單位時間內(nèi)識別文本的單詞數(shù)量作為語速指標(biāo); 步驟1-2:在事先采集的空管語音識別訓(xùn)練數(shù)據(jù)集上分別統(tǒng)計(jì)中文語速和英文語速; 步驟1-3:設(shè)定中文語音的正常語速區(qū)間為字符秒,其中,其中為中文正常語速最低值,和為中文正常語速最高值和通過計(jì)算所述空管語音識別訓(xùn)練數(shù)據(jù)集中字符速率確定; 步驟1-4:設(shè)定英文語音的正常語速區(qū)間為單詞秒,其中,為英文正常語速最低值,為英文正常語速最高值,和通過計(jì)算所述空管語音識別訓(xùn)練數(shù)據(jù)集中單詞速率確定; 步驟2-2中所述的語速估計(jì)層,具體包括: 步驟2-2-1:接收空管語音識別模型主干網(wǎng)絡(luò)輸出的原始logits序列,記為,其中,為為時間步數(shù)T所對應(yīng)的原始logits序列,為時間步數(shù),為詞匯表大小; 步驟2-2-2:對原始logits序列進(jìn)行銳化操作:將原始logits乘以預(yù)設(shè)的放大系數(shù),得到銳化后的logits,記為; 步驟2-2-3:計(jì)算加權(quán)字符概率分布:對銳化后的logits沿詞匯維度執(zhí)行softmax操作,生成概率分布矩陣,其中,為激活函數(shù),是模型輸出的時間維度大小,是模型輸出的詞表維度大小; 步驟2-2-4:基于概率分布矩陣估計(jì)有效字符數(shù)量; 步驟2-2-5:計(jì)算有效字符速率,根據(jù)輸入語音時長,輸出速率; ; 其中,對于英文語音,所述詞表維度大小V以完整單詞為基本單位,故表征估計(jì)的單詞數(shù)量,輸出速率單位相應(yīng)為單詞秒;對于中文語音,所述詞表維度大小V以字符為基本單位,故表征估計(jì)的字符數(shù)量;輸出速率單位相應(yīng)為字符秒。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人中國電子科技集團(tuán)公司第二十八研究所,其通訊地址為:210023 江蘇省南京市棲霞區(qū)仙林靈山南路1號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 超威半導(dǎo)體公司加布里埃爾·H·羅獲國家專利權(quán)
- 北京三快在線科技有限公司史震獲國家專利權(quán)
- 牛津大學(xué)科技創(chuàng)新有限公司西蒙·約翰·戴維斯獲國家專利權(quán)
- 中國醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)院蘇龍翔獲國家專利權(quán)
- 三菱電機(jī)株式會社藏堀貴大獲國家專利權(quán)
- 浙江龍芯電驅(qū)動科技有限公司王麗獲國家專利權(quán)
- 華為技術(shù)有限公司尤索·海斯卡寧獲國家專利權(quán)
- 北京航空航天大學(xué)沈明珠獲國家專利權(quán)
- 廣州方邦電子股份有限公司蘇陟獲國家專利權(quán)
- 佛山市迪趣智能科技有限公司葉國清獲國家專利權(quán)


熱門推薦
- 惠州市兆光光電科技有限公司朱天保獲國家專利權(quán)
- 日產(chǎn)化學(xué)株式會社忰山高大獲國家專利權(quán)
- 第一資本服務(wù)有限責(zé)任公司威廉·杜安獲國家專利權(quán)
- 浙江中寶自控元件有限公司王林煒獲國家專利權(quán)
- 上海禾賽科技股份有限公司毛勝平獲國家專利權(quán)
- 沃卡爾有限公司納達(dá)夫·耶林獲國家專利權(quán)
- 考特克斯·特克斯羅恩有限公司及兩合公司克里斯·戴維斯獲國家專利權(quán)
- 三菱電機(jī)株式會社佐佐木肇獲國家專利權(quán)
- 廣東電網(wǎng)有限責(zé)任公司譚家祺獲國家專利權(quán)
- 科濟(jì)生物醫(yī)藥(上海)有限公司李宗海獲國家專利權(quán)