中移(蘇州)軟件技術有限公司;中國移動通信集團有限公司桑杲獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉中移(蘇州)軟件技術有限公司;中國移動通信集團有限公司申請的專利跨領域文本分類模型的訓練方法、分類方法和裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116263785B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211435736.2,技術領域涉及:G06F16/353;該發明授權跨領域文本分類模型的訓練方法、分類方法和裝置是由桑杲設計研發完成,并于2022-11-16向國家知識產權局提交的專利申請。
本跨領域文本分類模型的訓練方法、分類方法和裝置在說明書摘要公布了:本發明公開了一種跨領域文本分類模型的訓練方法、分類方法和裝置,其中方法包括:獲取源域和目標域的兩種樣本集,分別輸入到表征學習器中,得到各樣本的局部嵌入信息和全局嵌入信息;將各個局部嵌入信息和全局嵌入信息進行融合,分別得到對應的深層語義特征;根據第一深層語義信息確定分類器損失和第一標簽,根據第二深層語義信息得到第二標簽;根據各深層語義信息和領域鑒別器,確定域對抗損失;通過不同域的文本圖樣本之間的差異,確定類對齊損失;進行迭代更新訓練,優化分類器損失、類對齊損失和域對抗損失,直到滿足訓練結束條件,確定跨領域文本分類模型。通過上述方式,本發明實現了模型由源域向目標域的遷移,提高了文本分類的精確度。
本發明授權跨領域文本分類模型的訓練方法、分類方法和裝置在權利要求書中公布了:1.一種跨領域文本分類模型的訓練方法,所述方法包括: 獲取第一文本圖樣本集和第二文本圖樣本集,分別輸入到表征學習器中,得到與各個文本圖樣本對應的局部嵌入信息和全局嵌入信息; 基于注意力機制分別將各個所述局部嵌入信息和所述全局嵌入信息進行融合,得到第一深層語義特征和第二深層語義特征; 將所述第一深層語義特征輸入到標簽分類器,確定分類器損失和第一標簽,將所述第二深層語義特征輸入到所述標簽分類器得到第二標簽;具體包括:將所述第一深層語義特征輸入到標簽分類器中得到第一標簽的預測值;根據所述預測值和所述第一文本圖樣本集中的帶有標簽的節點的真實值確定交叉熵損失,并將所述交叉熵損失作為分類器損失;將所述第二深層語義特征輸入到所述標簽分類器中得到相應各節點的輸出編碼,并根據所述輸出編碼確定所述第二標簽; 將所述第一深層語義特征和所述第二深層語義特征輸入到領域鑒別器,確定域對抗損失;具體包括:將所述第一深層語義特征和所述第二深層語義特征輸入到領域鑒別器得到領域標簽值;根據所述領域標簽值和土方移動距離計算得到第一文本圖樣本集和第二文本圖樣本集之間的域對抗損失; 根據第一文本圖樣本集和第二文本圖樣本集中的同一類文本圖樣本之間的差異,確定類對齊損失; 進行迭代更新訓練,優化所述分類器損失、所述類對齊損失和所述域對抗損失,直到滿足訓練結束條件,確定所述跨領域文本分類模型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中移(蘇州)軟件技術有限公司;中國移動通信集團有限公司,其通訊地址為:215163 江蘇省蘇州市高新區昆侖山路58號1幢;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。