南京郵電大學劉暢獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南京郵電大學申請的專利基于原始波形與協同理解的智能合成歌聲檢測方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120526810B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202511028445.5,技術領域涉及:G10L25/69;該發明授權基于原始波形與協同理解的智能合成歌聲檢測方法及系統是由劉暢;徐小龍設計研發完成,并于2025-07-25向國家知識產權局提交的專利申請。
本基于原始波形與協同理解的智能合成歌聲檢測方法及系統在說明書摘要公布了:本發明公開了基于原始波形與協同理解的智能合成歌聲檢測方法及系統,涉及信息取證安全與人工智能技術領域,使用音樂源分離模型Demucs對歌聲樣本進行分離,得到純人聲和伴奏聲;將伴奏聲送入伴奏聲碼器,提取伴奏序列特征;將純人聲送入人聲編碼器,提取人聲序列特征;同步將人聲原始波形送入正交編碼器,提取基于原始波形的底層序列特征;并采用自注意力機制進行歌聲特征聚合;將聚合后的特征送入基于圖的后端,得到對應的第一樣本置信度得分,同時將基于原始波形的底層特征并行送入基于圖的后端,得到對應的第二樣本置信度得分;對第一和第二樣本置信度得分進行分數級融合,得到最終檢測結果,有效地提高了模型在各種條件下的檢測能力。
本發明授權基于原始波形與協同理解的智能合成歌聲檢測方法及系統在權利要求書中公布了:1.基于原始波形與協同理解的智能合成歌聲檢測方法,其特征在于,方法包括以下步驟: 獲取歌聲樣本數據,將歌聲樣本數據輸入至預先建立的音樂源分離模型Demucs內,輸出得到純人聲數據和伴奏聲數據,將純人聲數據和伴奏聲數據進行預處理,得到處理后的純人聲數據和伴奏聲數據; 將處理后的純人聲數據輸入至預構建人聲編碼器內,輸出得到人聲序列特征,將處理后的伴奏聲數據輸入至預構建伴奏編碼器內,輸出得到伴奏序列特征,將人聲序列特征和伴奏序列特征進行特征拼接,得到拼接特征,將拼接特征進行聚合得到聚合特征; 獲取人聲原始波形,將人聲原始波形輸入至預構建正交編碼器內,輸出得到基于人聲原始波形的底層序列特征,將聚合特征和基于人聲原始波形的底層序列特征分別輸入基于圖的后端,輸出得到第一樣本置信度得分和第二樣本置信度得分; 所述將人聲原始波形輸入至預構建正交編碼器內,輸出得到基于人聲原始波形的底層序列特征,包括: 正交編碼器基于Sinc-conv的可微前端; 正交編碼器特征提取過程表示為: 其中表示歌聲經過分離后的人聲,表示正交編碼器,表示由提取的基于人聲原始波形的底層序列特征,、、分別表示通道數,頻帶間隔數和時間樣本數; 將第一樣本置信度得分和第二樣本置信度得分進行分數級融合,得到檢測結果,并輸入至預先建立的合成歌聲檢測模型內,根據訓練損失迭代優化樣本的檢測結果,輸出得到訓練后的合成歌聲檢測模型,獲取待檢測歌聲樣本,將待檢測歌聲樣本輸入至訓練后的合成歌聲檢測模型內,輸出得到歌聲檢測結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京郵電大學,其通訊地址為:210023 江蘇省南京市棲霞區文苑路9號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。