廈門市美亞柏科信息股份有限公司涂自龍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉廈門市美亞柏科信息股份有限公司申請的專利一種融合多元信息的黑灰產短信識別方法及其系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115878806B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310003772.X,技術領域涉及:G06F16/353;該發明授權一種融合多元信息的黑灰產短信識別方法及其系統是由涂自龍;朱振水;王仁斌;陳孝云設計研發完成,并于2023-01-03向國家知識產權局提交的專利申請。
本一種融合多元信息的黑灰產短信識別方法及其系統在說明書摘要公布了:本發明提出了一種融合多元信息的黑灰產短信識別方法,包括:對獲取的原始文本進行AI文本還原生成正常文本,所述正常文本經特征提取后,將提取獲得的特征向量輸入預先設置的AI文本分類模型中,完成正常特征分類任務;對獲取的原始文本進行多元特征提取,并進一步進行多元特征融合,完成多模態分類任務;將獲取的正常文本的特征與多元信息特征這兩個模態下的特征進行多模態融合,完成多元特征分類任務;進行加權loss更新得到最終的多任務學習模型。通過融合多元特征信息以提高AI建模技術的模型識別效果,減小誤差的累積傳遞;同時結合多模態融合與多任務學習增強模型效果;再通過數據增強方法提升模型魯棒性與泛化能力,并解決傳統做法中的痛點問題。
本發明授權一種融合多元信息的黑灰產短信識別方法及其系統在權利要求書中公布了:1.一種融合多元信息的黑灰產短信識別方法,其特征在于,該方法包括如下步驟: S1、對獲取的原始文本進行AI文本還原生成正常文本,所述正常文本經特征提取后,將提取獲得的特征向量輸入預先設置的AI文本分類模型中,完成正常特征分類任務task1; S2、對獲取的原始文本進行多元特征提取,并進一步進行多元特征融合,再將獲得的多元特征向量輸入預先設置的AI文本分類模型中,完成多模態分類任務task2; S3、將S1獲取的所述正常文本的特征與S2中經多元特征融合獲得的多元信息特征這兩個模態下的特征進行多模態融合,再將獲得的多模態向量輸入預先設置的AI文本分類模型中,完成多元特征分類任務task3; S4、將所述正常特征分類任務task1、所述多模態分類任務task2以及所述多元特征分類任務task3進行加權loss更新得到最終的多任務學習模型; 其中,所述正常特征分類任務task1、所述多模態分類任務task2以及所述多元特征分類任務task3同時進行;所述AI文本還原使用基于FairSeq工具庫的AI文本還原模型,所述AI文本分類模型采用集成學習CastBoost; 所述多元特征提取包括:根據字符分詞規則CharTokenizerRule對所述原始文本進行分詞,分詞后對句子中每個字符進行編碼特征提取,獲取每個字符的所述多元信息特征,所述多元信息特征包括Bert特征、拼音特征、筆畫特征、字型結構特征、四角編碼特征、五筆特征、鄭碼特征、偏旁部首特征、Unicode編碼特征、GBK編碼特征、TFIDF特征;采用線性映射Linear將獲取的所述多元信息特征進行特征維度擴充,并確保映射為相同的維度;將線性映射Linear后的特征進行特征拼接FeatureConcat,完成所述多元特征提取。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廈門市美亞柏科信息股份有限公司,其通訊地址為:361000 福建省廈門市思明區軟件園二期觀日路12號102-402單元;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。