北京百度網(wǎng)訊科技有限公司趙情恩獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉北京百度網(wǎng)訊科技有限公司申請的專利聲紋識別方法、裝置、電子設備及存儲介質獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN114333848B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-09-19發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202210039720.3,技術領域涉及:G10L17/02;該發(fā)明授權聲紋識別方法、裝置、電子設備及存儲介質是由趙情恩;梁蕓銘;張銀輝設計研發(fā)完成,并于2022-01-12向國家知識產(chǎn)權局提交的專利申請。
本聲紋識別方法、裝置、電子設備及存儲介質在說明書摘要公布了:本公開提供了一種聲紋識別方法、裝置、電子設備及存儲介質,涉及計算機技術領域,尤其涉及語音識別、深度學習等人工智能技術領域。具體實現(xiàn)方案為:獲取待識別的第一音頻數(shù)據(jù);將所述第一音頻數(shù)據(jù)輸入預設的聲紋識別模型中,以獲取所述聲紋識別模型輸出的第一聲紋特征及第二聲紋特征,其中,所述預設的聲紋識別模型為基于用于識別聲紋分布概率的教師模型及標注了用戶標簽的訓練數(shù)據(jù)訓練生成的;根據(jù)所述第一聲紋特征及第二聲紋特征,確定所述第一音頻數(shù)據(jù)對應的目標聲紋特征。由此,通過從聲紋分布概率及對應的用戶標簽兩個角度,對音頻數(shù)據(jù)進行聲紋識別,從而提高了獲取的目標聲紋特征的準確性。
本發(fā)明授權聲紋識別方法、裝置、電子設備及存儲介質在權利要求書中公布了:1.一種聲紋識別方法,包括: 獲取待識別的第一音頻數(shù)據(jù); 將所述第一音頻數(shù)據(jù)輸入預設的聲紋識別模型中,以獲取所述聲紋識別模型輸出的第一聲紋特征及第二聲紋特征,其中,所述預設的聲紋識別模型為基于用于識別聲紋分布概率的教師模型及標注了用戶標簽的訓練數(shù)據(jù)訓練生成的; 根據(jù)所述第一聲紋特征及第二聲紋特征,確定所述第一音頻數(shù)據(jù)對應的目標聲紋特征; 在所述將所述第一音頻數(shù)據(jù)輸入預設的聲紋識別模型中之前,還包括: 獲取第一訓練數(shù)據(jù)集及已生成的教師模型,其中,所述第一訓練數(shù)據(jù)集為文本相關音頻數(shù)據(jù)集,所述教師模型為基于文本無關的第二訓練數(shù)據(jù)集生成的; 將所述第一訓練數(shù)據(jù)集中的第二音頻數(shù)據(jù),分別輸入所述教師模型及初始學生模型,以獲取所述教師模型輸出的第一聲紋分布概率、所述初始學生模型輸出的第二聲紋分布概率及所述初始學生模型輸出的預測標簽; 根據(jù)所述預測標簽與所述第一音頻數(shù)據(jù)對應的標注標簽的差異、及所述第二聲紋分布概率與所述第一聲紋分布概率的差異,對所述初始學生模型進行修正,以獲取所述預設的聲紋識別模型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或專利權人北京百度網(wǎng)訊科技有限公司,其通訊地址為:100085 北京市海淀區(qū)上地十街10號百度大廈二層;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。