合肥工業(yè)大學柴一棟獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網獲悉合肥工業(yè)大學申請的專利基于通用對抗擾動生成網絡的高隱蔽性對抗語音樣本生成方法獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產權局授予,授權公告號為:CN118692471B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202410628854.8,技術領域涉及:G10L17/02;該發(fā)明授權基于通用對抗擾動生成網絡的高隱蔽性對抗語音樣本生成方法是由柴一棟;陳鈺瑩;劉依;劉龍順;劉昊鑫;潘岳;黃阿美;葛欣悅;劉洋;王新梅設計研發(fā)完成,并于2024-05-21向國家知識產權局提交的專利申請。
本基于通用對抗擾動生成網絡的高隱蔽性對抗語音樣本生成方法在說明書摘要公布了:本發(fā)明公開了一種基于通用對抗擾動生成網絡的高隱蔽性對抗語音樣本生成方法,包括:1處理音頻數(shù)據得到音頻采樣值,根據文件名稱設置標簽值;2構建通用對抗擾動生成網絡,設計說話人識別模塊和對抗樣本檢測模塊以及通用對抗擾動生成模塊的網絡結構;3說話人識別模塊的損失函數(shù)與對抗樣本檢測模塊的損失函數(shù)以及通用對抗擾動生成模塊的損失函數(shù)的加權和作為損失函數(shù);4將音頻數(shù)據輸入到通用對抗擾動生成網絡并進行訓練,調整網絡參數(shù),得到最優(yōu)模型。本發(fā)明能夠實現(xiàn)說話人識別模型無論是非目標攻擊還是目標攻擊均實現(xiàn)高攻擊成功率,在生成高對樣音頻質量且高隱蔽性的情況下,實現(xiàn)實時快速部署,提高了說話人識別模型的魯棒性。
本發(fā)明授權基于通用對抗擾動生成網絡的高隱蔽性對抗語音樣本生成方法在權利要求書中公布了:1.一種基于通用對抗擾動生成網絡的高隱蔽性對抗語音樣本生成方法,其特征在于,包括如下步驟: 步驟一:從一個音頻序列采樣第幀音頻={};其中,表示第幀音頻中第個采樣點的音頻值;為中的采樣點總數(shù); 通過生成方法UAP-GN生成音頻的對抗音頻={};其中,表示的對抗音頻,令的說話人身份ID為,,其中,N為說話者的總數(shù);令的判別標簽為1、的判別標簽為0; 步驟二:構建通用對抗擾動生成網絡,包括:說話人識別模塊R和對抗樣本檢測模塊D以及通用對抗擾動生成模塊G; 步驟2.1:所述說話人識別模塊R采用Sinc-Net網絡對進行處理,輸出第幀音頻的說話人預測標簽的概率向量; 基于和構建交叉熵損失函數(shù),并利用RMSProp優(yōu)化算法對說話人識別模塊R進行預訓練,得到預訓練后的說話人識別模塊; 步驟2.2:所述對抗樣本檢測模塊D采用CNN網絡對和分別進行處理,得到一維音頻判別矩陣和一維對抗音頻判別矩陣; 基于的判別標簽和構建二分類交叉熵,基于的判別標簽和構建二分類交叉熵,并利用Adam優(yōu)化算法對所述對抗樣本檢測模塊D進行預訓練,得到訓練后的對抗樣本檢測模塊; 步驟2.3:通用對抗擾動生成模塊G對對應的一維標準高斯噪聲進行處理,得到一維通用對抗擾動; 步驟三:建立通用對抗擾動生成網絡的優(yōu)化目標; 利用式1和式2分別建立通用對抗擾動生成模塊G的無目標攻擊優(yōu)化目標和目標攻擊優(yōu)化目標; 1 2 式1和式2中,是通用對抗擾動生成模塊G的損失函數(shù);其中,U是預先設定的說話人識別模塊R期望的說話人標簽; 步驟四:利用Adam法對所述通用對抗擾動生成網絡進行訓練,并計算損失函數(shù)以更新網絡的參數(shù),直到達到最大訓練次數(shù)后,停止訓練,從而得到最優(yōu)通用對抗擾動生成網絡,用于識別說話人的身份。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或專利權人合肥工業(yè)大學,其通訊地址為:230009 安徽省合肥市包河區(qū)屯溪路193號;或者聯(lián)系龍圖騰網官方客服,聯(lián)系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數(shù)據和信息,力求客觀、公正,但并不保證數(shù)據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。