深圳市華訊互通科技有限公司李勇獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉深圳市華訊互通科技有限公司申請的專利智能語音識別交互方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119541462B 。
龍圖騰網通過國家知識產權局官網在2025-08-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411818078.4,技術領域涉及:G10L15/02;該發明授權智能語音識別交互方法及系統是由李勇設計研發完成,并于2024-12-10向國家知識產權局提交的專利申請。
本智能語音識別交互方法及系統在說明書摘要公布了:本發明公開了一種智能語音識別交互方法及系統,通過建立云平臺與用戶客戶端的網絡連接,實時傳輸用戶音頻數據與網絡狀態信息。根據網絡狀態劃分傳輸時間段并設定等級,對音頻數據進行相應劃分。利用語音識別模型識別音頻特征,并通過自編碼網絡重構特征向量,計算音頻特征相似度。基于狀態等級與相似度設定數據可信度并作為權值,從實時音頻中提取出第二音頻傳輸數據。構建GAN生成模型并導入第二音頻數據進行特征學習,生成用戶音頻訓練數據,用于訓練語音識別模型,有效提高音頻識別效果,提高語音識別平臺的交互效率。
本發明授權智能語音識別交互方法及系統在權利要求書中公布了:1.一種智能語音識別交互方法,其特征在于,包括: 對云平臺與用戶客戶端建立網絡連接,并應用于用戶網絡會議過程,通過實時網絡傳輸,在一個分析周期內,獲取用戶客戶端的音頻傳輸數據; 通過實時網絡傳輸,獲取所述一個分析周期內的網絡傳輸狀態信息,基于網絡狀態劃分出多個傳輸時間段,并對多個傳輸時間段設定狀態等級,基于多個傳輸時間段對音頻傳輸數據進行相應數據劃分,形成多個音頻數據段; 通過語音識別模型對音頻數據段進行識別并從系統數據庫中提取出用戶音頻特征; 對音頻數據段進行音頻特征提取與特征向量轉換,形成音頻特征向量數據,通過自編碼網絡對音頻特征向量數據進行數據重構,生成重構特征向量數據,將用戶音頻特征與重構特征向量數據進行數據相似度計算,得到音頻特征相似度; 根據每個音頻數據段的狀態等級與音頻特征相似度設定數據可信度,以數據可信度作為每個音頻數據段的權值,基于權值,從音頻傳輸數據中進行數據提取,提取過程以權值作為每個音頻數據段的數據比例,得到第二音頻傳輸數據; 構建基于GAN的生成模型,將第二音頻傳輸數據作為真實數據導入生成模型進行特征學習并生成用戶音頻訓練數據; 通過用戶音頻訓練數據,對語音識別模型進行訓練,并通過語音識別模型進行用戶網絡會議過程的用戶交互識別。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人深圳市華訊互通科技有限公司,其通訊地址為:518000 廣東省深圳市寶安區新安街道海濱社區甲岸南路22號易尚創意科技大廈2202;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。