北京中科深智科技有限公司梁晨陽獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京中科深智科技有限公司申請的專利一種面向語音合成的自動化語音數據校驗方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116524899B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310546553.6,技術領域涉及:G10L13/08;該發明授權一種面向語音合成的自動化語音數據校驗方法是由梁晨陽設計研發完成,并于2023-05-15向國家知識產權局提交的專利申請。
本一種面向語音合成的自動化語音數據校驗方法在說明書摘要公布了:一種面向語音合成的自動化語音數據校驗方法,包括如下步驟:步驟一:由專業的聲優在專業的錄音棚錄制音頻語料;步驟二:聲優錄制好一段完整的音頻后,開始對音頻剪輯處理;步驟三:對整段錄制的音頻進行裁剪后,對各個短音頻進行自動語音識別,獲得每個音頻文件對應的文本;步驟四:對獲得的臺詞音頻數據和對應的臺詞文本進行多字少字校驗并處理;步驟五:獲得的臺詞音頻數據和對應的臺詞文本進行錯別字檢查并修正,以保證訓練數據和標簽沒有錯誤和異常值。本發明利用深度學習技術,以及針對語音合成數據處理流程特點,結合自然語言處理和信號處理方法,實現自動化地對語音合成數據進行校驗和清洗,以提高語音合成數據處理的效率和準確性。
本發明授權一種面向語音合成的自動化語音數據校驗方法在權利要求書中公布了:1.一種面向語音合成的自動化語音數據校驗方法,其特征在于:包括如下步驟: 1-1:由專業的聲優在專業的錄音棚錄制音頻語料; 1-2:聲優錄制好一段完整的音頻后,開始對音頻剪輯處理,獲得訓練音頻數據; 1-3:對整段錄制的音頻進行裁剪后,我們得到若干條的短音頻文件,對各個短音頻進行自動語音識別,獲得每個音頻文件對應的文本,然后根據臺詞順序對臺詞文本進行音頻召回處理,得到了若干條音頻數據; 1-4:對獲得的臺詞音頻數據和對應的臺詞文本進行多字少字校驗并處理,以保證訓練數據和標簽沒有錯誤和異常值; 1-5:對獲得的臺詞音頻數據和對應的臺詞文本進行錯別字檢查并修正,以保證訓練數據和標簽沒有錯誤和異常值; 所述的1-3中根據臺詞順序對臺詞文本進行音頻召回處理的集體操作包括如下步驟: 1-3-1:為了合并因語氣停頓被分割開的音頻,首先對每個音頻文件做靜音檢測,如果音頻文件最后一幀非靜音幀,說明該處截取是因為語氣停頓,對該音頻文件做標記以待處理; 1-3-2:首先按臺詞文本順序取兩條待召回臺詞文本text_a和文本text_b,文本text_a為當前需要召回的音頻文本,文本text_b為下一個需要召回的音頻文本; 1-3-3:那么先判斷wav_b中是否包含‘重來’,如果是就回到1-3-2步重新開始,否則進入1-3-4; 1-3-4:按順序取兩條音頻的語音識別文本wav_a和wav_b,分別用wav_a和wav_b與text_a和text_b,做相似距離計算,相似距離計算公式如下: Match_ab=EDwav_a,text_b–|lenwav_a-lentext_b| 其中,EDwav_a,text_b表示wav_a和text_b的編輯距離,|lenwav_a-lentext_b|表示wav_a和text_b文本長度差的絕對值; 1-3-5:如果音頻a屬于1-3-1中因語氣停頓而被剪輯的音頻,判斷Match_a+bb是否大于Match_ab,若Match_a+bb大于Match_ab,把音頻a中靜音幀以后的有聲幀裁剪掉,然后合并音頻a和音頻b為新的音頻a,同時合并文本,再按順序選取下一條音頻為音頻b,回到1-3-3開始,若Match_a+bb不大于Match_ab,把音頻a中靜音幀以后的有聲幀裁剪掉,進入1-3-6; 1-3-6:判斷Match_aa和Match_ba大小,若Match_aa小于Match_ba,那么把音頻b變為音頻a,再按順序選取下一條音頻為音頻b,回到1-3-3開始;否則,比較Match_ba和Match_bb大小,若Match_ba小于Match_bb且Match_bb大于12lenwav_b,則音頻a為文本a對應的音頻,繼續把音頻b和文本b改為音頻a和文本a,再按順序選取下一條音頻為音頻b和文本b,回到1-3-3開始,否則直接再按順序選取下一條音頻為音頻b和文本b,回到1-3-3開始; 1-3-7:循環直到召回所有臺詞音頻。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京中科深智科技有限公司,其通訊地址為:100000 北京市大興區永昌中路4號院4號樓3層311A室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。