上海聲通信息科技股份有限公司湯敬華獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉上海聲通信息科技股份有限公司申請的專利一種錄音聲道分割方法、設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN118609589B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202410777609.3,技術領域涉及:G10L25/18;該發明授權一種錄音聲道分割方法、設備及存儲介質是由湯敬華;鄭波;李鍇;王宗偉設計研發完成,并于2024-06-17向國家知識產權局提交的專利申請。
本一種錄音聲道分割方法、設備及存儲介質在說明書摘要公布了:本申請提供一種錄音聲道分割方法、設備及存儲介質。包括:獲取單聲道錄音的待分割錄音,待分割錄音中包括至少兩個錄音對象的錄音段。從待分割錄音中提取頻譜特征,并將頻譜特征輸入訓練好的錄音分割模型中,通過錄音分割模型輸出至少兩個錄音對象的排列信息,以及,嵌入向量數組。根據嵌入向量數組,以及,各時間塊內的各排列信息,獲取非靜音時間塊,根據非靜音時間塊對應的嵌入向量數組,生成距離矩陣。根據距離矩陣,以及,與錄音對象的數量相關的先驗信息,通過層次聚類算法確定各時間塊的標注信息。根據標注信息,生成待分割錄音對應的RTTM文件。根據RTTM文件生成分割聲道后的錄音。本申請的方法,優化了電話錄音的存儲和處理方式。
本發明授權一種錄音聲道分割方法、設備及存儲介質在權利要求書中公布了:1.一種錄音聲道分割方法,其特征在于,所述方法包括: 獲取待分割錄音,所述待分割錄音為單聲道錄音,所述待分割錄音中包括至少兩個錄音對象的錄音段; 從所述待分割錄音中提取所述待分割錄音的頻譜特征,并將所述待分割錄音的頻譜特征輸入訓練好的錄音分割模型中,所述錄音分割模型用于將所述待分割錄音中包括的至少兩個錄音對象的錄音段分割為單個錄音對象的錄音段; 通過所述錄音分割模型輸出所述至少兩個錄音對象的排列信息,以及,嵌入向量數組,所述排列信息包括每個時間塊內所述至少兩個錄音對象的標識排列信息、時間排列信息、活動狀態排列信息,所述嵌入向量數組用于表征不同錄音對象的錄音段特征,所述嵌入向量數組中的嵌入向量數量與所述待分割錄音中包括的錄音對象的數量相關; 根據所述嵌入向量數組,以及,各所述時間塊內的各排列信息,獲取非靜音時間塊; 根據所述非靜音時間塊對應的嵌入向量數組,生成距離矩陣,所述距離矩陣用于表征所述非靜音時間塊對應的嵌入向量數組中嵌入向量之間的距離; 根據所述距離矩陣,以及,與所述錄音對象的數量相關的先驗信息,通過層次聚類算法確定各所述時間塊的標注信息,所述標注信息用于標注所述時間塊對應的錄音對象; 根據所述標注信息,生成所述待分割錄音對應的RTTM文件,所述RTTM文件中包括有效音頻起始時間,以及,所述有效音頻起始時間對應的錄音對象的標識; 根據所述RTTM文件生成分割聲道后的錄音,所述錄音中不同聲道對應不同錄音對象的錄音段。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人上海聲通信息科技股份有限公司,其通訊地址為:201199 上海市閔行區顧戴路2337號維璟中心G棟7DEF座;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。