平安科技(深圳)有限公司歐陽升獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉平安科技(深圳)有限公司申請的專利文本分類方法、文本分類裝置、計算機設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116680400B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310717358.5,技術領域涉及:G06F16/353;該發明授權文本分類方法、文本分類裝置、計算機設備及存儲介質是由歐陽升;王健宗;程寧設計研發完成,并于2023-06-16向國家知識產權局提交的專利申請。
本文本分類方法、文本分類裝置、計算機設備及存儲介質在說明書摘要公布了:本申請實施例提供了一種文本分類方法、文本分類裝置、計算機設備及存儲介質,屬于金融科技技術領域。該方法包括:獲取初始文本數據,第一標注文本的文本數量小于第二標注文本的文本數量;對未標注的改寫文本進行類別預測得到掩碼類別;若第一標注類別和掩碼類別相同,將未標注文本確定為初始擴充文本;根據初始擴充文本和聚類中心數據確定類別距離;根據類別距離對初始擴充文本進行篩選確定目標擴充文本;對目標擴充文本和初始文本數據合并,確定第一數據集和第二數據集;根據第一數據集和第二數據集對初始分類模型進行參數調整得到文本分類模型;并根據文本分類模型對目標文本進行文本分類。本申請實施例能夠提高文本分類的準確性。
本發明授權文本分類方法、文本分類裝置、計算機設備及存儲介質在權利要求書中公布了:1.一種文本分類方法,其特征在于,所述方法包括: 獲取初始文本數據,所述初始文本數據包括初始標注數據和未標注文本,所述初始標注數據包括標注有第一標注類別的第一標注文本和標注有第二標注類別的第二標注文本,其中,所述第一標注文本的文本數量小于所述第二標注文本的文本數量; 根據預設提示模板對所述未標注文本進行文本改寫,得到改寫文本,并將所述改寫文本輸入至預設的掩碼預測模型進行掩碼類別預測,得到所述改寫文本的掩碼類別; 若所述第一標注類別和所述掩碼類別相同,將所述未標注文本確定為初始擴充文本; 獲取所述第一標注文本的第一聚類中心數據和所述第二標注文本的第二聚類中心數據,根據所述初始擴充文本和所述第一聚類中心數據確定第一類別距離,根據所述初始擴充文本和所述第二聚類中心數據確定第二類別距離; 根據所述第一類別距離和所述第二類別距離對所述初始擴充文本進行文本篩選,確定目標擴充文本; 對所述目標擴充文本和所述第一標注文本進行合并,得到第一數據集,根據所述第二標注文本得到第二數據集,所述第一數據集的文本數量和所述第二數據集的文本數量相同; 根據所述第一數據集和所述第二數據集對預設的初始分類模型進行參數調整,得到文本分類模型; 根據所述文本分類模型對預先獲取到的目標文本進行文本分類。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人平安科技(深圳)有限公司,其通訊地址為:518000 廣東省深圳市福田區福田街道福安社區益田路5033號平安金融中心23樓;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。