福州大學廖祥文獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉福州大學申請的專利一種基于雙路編碼器的可解釋性文本分類系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115828142B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211628528.4,技術領域涉及:G06F18/24;該發明授權一種基于雙路編碼器的可解釋性文本分類系統是由廖祥文;徐攀;林于翔;沈鴻驍;姚孟韜設計研發完成,并于2022-12-17向國家知識產權局提交的專利申請。
本一種基于雙路編碼器的可解釋性文本分類系統在說明書摘要公布了:本發明提供一種基于雙路編碼器的可解釋性文本分類系統,包括:包含一個預處理模塊,用于對文本進行特征化處理;包含一個編碼器模塊,用于獲取文本不同角度上的語義信息;包含一個分類器模塊,用于輸出文本分類結果;包含一個解釋性信息生成器模塊,用于輸出文本分類結果的文本解釋。應用本技術方案能夠通過融合多頭注意力與雙向門控循環單元的語義表示,學習文本的多層次的語義信息,并使用二次注意力機制,解決查詢和注意力結果不匹配問題,對編碼的語義信息進行增強,從而較好地實現可解釋性文本分類。
本發明授權一種基于雙路編碼器的可解釋性文本分類系統在權利要求書中公布了:1.一種基于雙路編碼器的可解釋性文本分類系統,其特征在于,包括: 一個預處理模塊,用于對文本進行特征化處理; 一個編碼器模塊,用于獲取文本不同角度上的語義信息; 一個分類器模塊,用于輸出文本分類結果; 一個解釋性信息生成器模塊,用于輸出文本分類結果的文本解釋; 解釋性信息生成器模塊使用條件變分自動編碼器CVAE生成文本型解釋性信息,解釋性信息生成器模塊由解釋信息編碼器、后驗網絡、先驗網絡、解碼器以及隱變量監督模塊五個部分組成;其中編碼器、解碼器使用基于多頭注意力的transformer編碼器,后驗網絡和先驗網絡均使用多層感知機,隱變量監督模塊是一個三層全連接網絡后接softmax函數的分類器;在訓練過程中,解釋性信息生成器模塊以解釋性信息、原文本的向量表示ve以及文本分類結果的向量表示vc作為輸入; 條件變分自動編碼器CVAE在訓練時需要最大化在只給定文本信息和文本分類結果信息[ve;vc]的條件下,vc對應文本分類結果的文本解釋信息x的條件似然變分下界,具體公式如下所示: 其中z為隱變量,c=[ve;vc]; 編碼器對解釋信息的嵌入表示進行編碼后,映射為向量表示x,用于估計px|z,c,記為pDx|z,c;先驗網絡以ve和vc的拼接為輸入,擬合潛在變量z'在未知目標文本條件下的先驗概率分布pz|c,記為PPZ∣C;通過最大化先驗概率分布的變分下界來訓練先驗網絡向后驗網絡進行逼近,輸出更好的隱變量z';后驗網絡以向量x、ve和vc的拼接為輸入,擬合隱變量z在已知目標文本條件下的后驗概率分布qRz|x,c,該分布估計真實的后驗概率分布;logpx|c的變分下界如下所示: 其中θ為網絡參數; 解碼器使用從后驗分布qRz|x,c中采樣獲得的隱變量z初始化隱藏狀態,以ve和目標文本嵌入表示x作為輸入,輸出每個時間步的單詞概率分布,并通過優化與實際目標評論摘要的交叉熵損失來進行訓練;引入隱變量監督模塊,通過隱變量z對文本進行分類,如果得到正確的分類說明隱變量z編碼足夠的源端信息,生成解釋信息;由此可得,CVAE中關于識別網絡與先驗網絡的損失函數為: 其中LZ為通過隱變量z對文本的分類損失; 在測試過程中,生成器模塊以文本的向量表示ve以及文本分類結果向量表示vc作為輸入;[ve;vc]輸入先驗網絡后,從先驗分布中采樣獲得隱變量z',解碼器使用該隱變量z'與目標解釋信息嵌入表示進行相加,逐時間步輸出目標單詞,生成最終解釋性信息。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人福州大學,其通訊地址為:350108 福建省福州市閩侯縣福州大學城烏龍江北大道2號福州大學;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。