北京百度網(wǎng)訊科技有限公司張傳強獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉北京百度網(wǎng)訊科技有限公司申請的專利語音識別的糾錯方法、模型訓(xùn)練方法及裝置獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN114299956B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-22發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202111413063.6,技術(shù)領(lǐng)域涉及:G10L15/26;該發(fā)明授權(quán)語音識別的糾錯方法、模型訓(xùn)練方法及裝置是由張傳強;張睿卿;何中軍;李芝;吳華設(shè)計研發(fā)完成,并于2021-11-25向國家知識產(chǎn)權(quán)局提交的專利申請。
本語音識別的糾錯方法、模型訓(xùn)練方法及裝置在說明書摘要公布了:本公開提供了一種語音識別的糾錯方法、模型訓(xùn)練方法及裝置,涉及人工智能技術(shù)領(lǐng)域,尤其涉及語音識別、自然語言處理技術(shù)領(lǐng)域。具體實現(xiàn)方案為:獲取語音信息的原始語音識別結(jié)果;識別所述原始語音識別結(jié)果中存在目標文本;將所述原始語音識別結(jié)果中的所述目標文本替換為預(yù)設(shè)標簽,生成候選語音識別結(jié)果;基于所述原始語音識別結(jié)果和所述候選語音識別結(jié)果,對所述目標文本進行糾錯。由此,可基于預(yù)設(shè)標簽實現(xiàn)語音識別結(jié)果的自動糾錯,適用性好,提高了語音識別的糾錯效率和正確率。
本發(fā)明授權(quán)語音識別的糾錯方法、模型訓(xùn)練方法及裝置在權(quán)利要求書中公布了:1.一種語音識別的糾錯方法,包括: 獲取語音信息的原始語音識別結(jié)果; 識別所述原始語音識別結(jié)果中存在目標文本; 將所述原始語音識別結(jié)果中的所述目標文本替換為預(yù)設(shè)標簽,生成候選語音識別結(jié)果; 獲取所述目標文本在所述原始語音識別結(jié)果中的文本位置; 將所述原始語音識別結(jié)果和所述候選語音識別結(jié)果輸入至目標掩碼語言模型MLM,由所述目標掩碼語言模型輸出所述文本位置處所述目標文本的第一得分和所述預(yù)設(shè)標簽的第二得分,其中,所述第一得分與所述文本位置處為所述目標文本的預(yù)測概率正相關(guān),所述第二得分與所述文本位置處為所述預(yù)設(shè)標簽的預(yù)測概率正相關(guān); 基于所述第一得分和所述第二得分,對所述目標文本進行糾錯。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人北京百度網(wǎng)訊科技有限公司,其通訊地址為:100085 北京市海淀區(qū)上地十街10號百度大廈二層;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。