廈門快商通科技股份有限公司葉林勇獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉廈門快商通科技股份有限公司申請的專利跨信道聲紋識別模型的訓練方法、聲紋識別方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116312559B 。
龍圖騰網通過國家知識產權局官網在2025-09-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310151115.X,技術領域涉及:G10L17/04;該發明授權跨信道聲紋識別模型的訓練方法、聲紋識別方法及裝置是由葉林勇;肖龍源;李海洲;李稀敏;葉志堅設計研發完成,并于2023-02-22向國家知識產權局提交的專利申請。
本跨信道聲紋識別模型的訓練方法、聲紋識別方法及裝置在說明書摘要公布了:本發明公開了一種跨信道聲紋識別模型的訓練方法、聲紋識別方法及裝置,通過收集不同信道數據集,處理得到訓練數據,采用改進的fbank特征提取算法對訓練數據分別提取fbank特征,得到fbank特征;采用第二fbank特征和第四fbank特征分別訓練聲紋識別模型,得到第一模型和第二模型,第一模型與第二模型通過融合結構組合構建得到第三模型;采用第一fbank特征訓練第三模型,得到第四模型,采用第三fbank特征訓練第四模型,得到跨信道聲紋識別模型。本發明采用改進的fbank特征提取算法提取fbank特征,并通過融合結構將第一模型的輸出和第二模型的輸出組合在一起,可有效提高聲紋識別模型在跨信道場景下的識別準確率,以解決跨信道聲紋識別模型訓練過程復雜,準確度低等問題。
本發明授權跨信道聲紋識別模型的訓練方法、聲紋識別方法及裝置在權利要求書中公布了:1.一種跨信道聲紋識別模型的訓練方法,其特征在于,包括以下步驟: S1,收集數據集,所述數據集包括基于第一信道的第一數據集和第二數據集以及基于第二信道的第三數據集和第四數據集,對所述數據集分別進行數據清洗和數據增強處理,得到訓練數據,所述訓練數據包括分別對應所述第一數據集、第二數據集、第三數據集和第四數據集的第一訓練數據、第二訓練數據、第三訓練數據和第四訓練數據; S2,采用改進的fbank特征提取算法對所述訓練數據分別提取fbank特征,得到fbank特征,所述fbank特征包括分別對應第一訓練數據、第二訓練數據、第三訓練數據和第四訓練數據的第一fbank特征、第二fbank特征、第三fbank特征和第四fbank特征; S3,采用所述第二fbank特征和第四fbank特征分別訓練聲紋識別模型,得到第一模型和第二模型,所述第一模型與第二模型通過融合結構組合構建得到第三模型,所述融合結構包括第一加法器、第一池化層、第一卷積層、第一歸一化層、第一激活函數層、第二卷積層、第二池化層、第三卷積層、第二歸一化層、第二激活函數層、第四卷積層、第二加法器、第三激活函數層、第一乘法器、第二乘法器和第三加法器,其中,所述第一池化層、第一卷積層、第一歸一化層、第一激活函數層、第二卷積層依次連接,所述第二池化層、第三卷積層、第二歸一化層、第二激活函數層、第四卷積層依次連接,所述第一模型的輸出與第二模型的輸出采用所述第一加法器進行相加,得到第一相加結果,所述第一相加結果分別輸入所述第一池化層和第二池化層,分別經過第一卷積層、第一歸一化層、第一激活函數層、第二卷積層以及第三卷積層、第二歸一化層、第二激活函數層、第四卷積層提取得到第一特征和第二特征,所述第一特征和第二特征采用所述第二加法器進行相加,得到第二相加結果,所述第二相加結果輸入所述第三激活函數層,所述第三激活函數層的輸出結果分別與所述第一模型的輸出與第二模型的輸出采用所述第一乘法器和第二乘法器進行相乘,得到第一相乘結果和第二相乘結果,所述第三激活函數層的輸出結果、所述第一相乘結果和第二相乘結果采用所述第三加法器進行相加,得到所述第三模型的輸出; S4,采用第一fbank特征訓練所述第三模型,得到第四模型,采用第三fbank特征訓練所述第四模型,得到跨信道聲紋識別模型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廈門快商通科技股份有限公司,其通訊地址為:361000 福建省廈門市軟件園三期誠毅北大街63號1301單元;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。