湖南大學;湖南大學深圳研究院張子興獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉湖南大學;湖南大學深圳研究院申請的專利基于細粒度對比學習的副語言信息識別方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119694325B 。
龍圖騰網通過國家知識產權局官網在2025-09-02發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411741979.8,技術領域涉及:G10L21/0208;該發明授權基于細粒度對比學習的副語言信息識別方法及系統是由張子興;吳怡萌;董忠仁;向武龍;申勝凡設計研發完成,并于2024-11-29向國家知識產權局提交的專利申請。
本基于細粒度對比學習的副語言信息識別方法及系統在說明書摘要公布了:本發明公開了一種基于細粒度對比學習的副語言信息識別方法及系統,方法包括:根據副語言數據集的副語言標簽生成不同風格的自然語言描述文本,然后進行降噪處理;使用音頻編碼器和文本編碼器進行特征提取后,對音頻特征數據樣本和文本特征數據樣本進行細粒度對比學習,將細粒度損失作為損失函數訓練音頻編碼器和文本編碼器;使用訓練好的音頻編碼器和文本編碼器進行特征提取,計算新的音頻特征數據與新的文本特征數據的相似度,并選取相似度最高的描述文本數據作為測試音頻數據的副語言信息。本發明能夠從語音中捕捉更加全面、開放的副語言信息,相比于傳統方法有效的提升了特征提取的準確性。
本發明授權基于細粒度對比學習的副語言信息識別方法及系統在權利要求書中公布了:1.一種基于細粒度對比學習的副語言信息識別方法,其特征在于,包括以下步驟: 根據副語言數據集的副語言標簽生成不同風格的自然語言描述文本,然后進行降噪處理; 使用音頻編碼器對副語言數據集的音頻數據進行特征提取得到音頻特征數據樣本,并使用文本編碼器對降噪處理后的自然語言描述文本進行特征提取得到文本特征數據樣本; 對音頻特征數據樣本和文本特征數據樣本進行細粒度對比學習,得到音頻特征數據樣本和文本特征數據樣本的相似性矩陣,以及音頻特征數據樣本和文本特征數據樣本的增強的真實值矩陣,然后將相似性矩陣和增強的真實值矩陣的細粒度損失作為損失函數訓練音頻編碼器和文本編碼器; 使用訓練好的音頻編碼器對測試音頻數據進行特征提取得到新的音頻特征數據,并使用訓練好的文本編碼器對測試集合中的描述文本數據進行特征提取得到新的文本特征數據,計算新的音頻特征數據與新的文本特征數據的相似度,并選取相似度最高的描述文本數據作為測試音頻數據的副語言信息。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人湖南大學;湖南大學深圳研究院,其通訊地址為:410082 湖南省長沙市岳麓區麓山南路麓山門;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。