北京百度網訊科技有限公司鄒賽賽獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京百度網訊科技有限公司申請的專利語音喚醒模型的訓練、喚醒方法、裝置、設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114842855B 。
龍圖騰網通過國家知識產權局官網在2025-09-05發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210356735.2,技術領域涉及:G10L17/22;該發明授權語音喚醒模型的訓練、喚醒方法、裝置、設備及存儲介質是由鄒賽賽;陳立;張若曦;賈磊;王海峰設計研發完成,并于2022-04-06向國家知識產權局提交的專利申請。
本語音喚醒模型的訓練、喚醒方法、裝置、設備及存儲介質在說明書摘要公布了:本公開提供了一種語音喚醒模型的訓練、喚醒方法、裝置、設備及存儲介質,涉及人工智能領域,尤其涉及深度學習、語音技術等領域。具體實現方案為:獲取創建的語音識別訓練數據以及語音喚醒訓練數據,首先根據語音識別訓練數據對基礎模型進行訓練,得到模型損失函數收斂時的基礎模型的模型參數;隨后基于模型配置指令更新基礎模型中解碼模塊的配置參數,得到第一模型;再根據語音喚醒訓練數據對第一模型進行訓練,在模型損失函數收斂時,獲得訓練好的語音喚醒模型。上述方案可提升語音喚醒模型訓練的收斂速度,基于上述語音喚醒模型對音頻數據進行處理分析,可提高識別精度,降低誤報率。
本發明授權語音喚醒模型的訓練、喚醒方法、裝置、設備及存儲介質在權利要求書中公布了:1.一種語音喚醒模型的訓練方法,包括: 獲取語音識別訓練數據,根據所述語音識別訓練數據對基礎模型進行語音識別訓練,得到模型損失函數收斂時的基礎模型的模型參數;所述基礎模型包括編碼模塊和解碼模塊; 響應于用戶發起的模型配置指令,基于所述基礎模型的模型參數,更新所述基礎模型中解碼模塊的配置參數,得到第一模型; 獲取語音喚醒訓練數據,根據所述語音喚醒訓練數據,對所述第一模型進行語音喚醒訓練,得到模型損失函數收斂時的第一模型; 將模型損失函數收斂時的第一模型作為所述語音喚醒模型; 所述響應于用戶發起的模型配置指令,基于所述基礎模型的模型參數,更新所述基礎模型中解碼模塊的配置參數,得到第一模型,包括: 響應于用戶發起的模型配置指令,基于所述基礎模型的模型參數,將所述基礎模型中所述解碼模塊的全連接子模塊和歸一化子模塊的輸出維度更新為二維,以使得所述第一模型的輸出結果包括喚醒和不喚醒兩種結果; 所述獲取語音喚醒訓練數據,包括: 將用戶輸入的第一音頻數據對應的FBank特征、語義標簽序列以及喚醒標簽,作為所述語音喚醒訓練的一組正例數據;所述第一音頻數據為包含自定義喚醒詞的音頻數據; 接收用戶輸入的第二音頻數據,對所述第二音頻數據進行特征提取,得到所述第二音頻數據對應的FBank特征;所述第二音頻數據為不包含所述自定義喚醒詞的音頻數據; 將所述第二音頻數據對應的FBank特征,隨機生成的語義標簽序列以及不喚醒標簽,作為所述語音喚醒訓練的一組負例數據;所述隨機生成的語義標簽序列與所述第二音頻數據對應的語義標簽序列不同。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京百度網訊科技有限公司,其通訊地址為:100085 北京市海淀區上地十街10號百度大廈2層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。