重慶郵電大學陳龍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉重慶郵電大學申請的專利一種基于改進粒子群算法的文本分類方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115168591B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210941615.9,技術領域涉及:G06F16/353;該發明授權一種基于改進粒子群算法的文本分類方法是由陳龍;黃嘉成設計研發完成,并于2022-08-08向國家知識產權局提交的專利申請。
本一種基于改進粒子群算法的文本分類方法在說明書摘要公布了:本發明屬于文本分類領域,具體涉及一種基于改進粒子群算法的文本分類方法,獲取原始情感語句文本數據集,對數據集中的原始情感語句文本打上類別標簽;將原始情感語句文本數據集作為第一訓練樣本對雙向長短時記憶神經網絡進行訓練,生成第一文本分類模型;根據原始情感語句文本構建無向圖并通過改進的粒子群算法計算得出最優對抗樣本;將原始情感語句文本數據集和最優對抗樣本作為第二訓練樣本,對第一文本分類模型進行對抗訓練,得到第二文本分類模型,將目標文本輸入第二分類模型進行分類,輸出分類結果,本方法擴展性強,可根據新發現的規則為無向圖追加新的節點,提供更豐富的模型訓練數據,提高模型分類的準確性。
本發明授權一種基于改進粒子群算法的文本分類方法在權利要求書中公布了:1.一種基于改進粒子群算法的文本分類方法,其特征在于,包括以下步驟: S1:獲取原始情感語句文本數據集,對數據集中的原始情感語句文本打上類別標簽; S2:將原始情感語句文本數據集作為第一訓練樣本對雙向長短時記憶神經網絡進行訓練,生成第一文本分類模型; S3:根據原始情感語句文本構建無向圖,根據無向圖通過改進的粒子群算法計算得出最優對抗樣本; 所述根據原始情感語句文本構建無向圖包括以下步驟: S21:將原始情感語句文本進行分詞處理,得到原始情感語句文本的原始分詞集合其中,表示原始分詞集合中第n個原始分詞,n∈[1,N],N表示原始分詞集合中原始分詞的數量; S22:將原始分詞作為無向圖的初始節點; S23:將原始分詞的拼音、原始分詞的英文翻譯和原始分詞的形近詞作為初始節點的鄰接節點; S24:將原始分詞的同音詞作為拼音節點的鄰接節點;將原始分詞的拼音字母組合作為拼音節點的鄰接節點; S25:將原始分詞的英語音譯作為英文翻譯節點的鄰接節點,從而獲得原始分詞的無向圖; 根據無向圖通過改進的粒子群算法計算得出對抗樣本的具體步驟包括: S31:將原始分詞的無向圖中所有節點均作為原始分詞的可替換詞,將原始分詞集合xo中所有原始分詞的可替換詞依次按照位置進行組合得到原始情感語句文本的對抗樣本集合,并將對抗樣本集合作為對抗樣本搜索空間; S32:將對抗樣本搜索空間中的對抗樣本輸入第一文本分類模型得到第一文本分類模型對對抗樣本類別標簽的置信度; 所述最優對抗樣本的計算過程具體包括: S321:根據原始分詞無向圖中的節點與初始節點之間的路徑信息、以及對抗樣本類別標簽的置信度構建粒子群算法的得分函數; 所述粒子群算法的得分函數包括: 其中,xa表示對抗樣本搜索空間中的一個對抗樣本,代表xa中的第n個原始分詞的可替換詞,表示第n個原始分詞的所有可替換詞構成的集合;Cxa表示第一文本分類模型對xa的類別標簽的置信度,代表xo和xa中所有原始分詞的可替換詞在無向圖中的路徑信息之和; S322:隨機初始化粒子群中粒子的速度和位置; S323:通過得分函數計算粒子群中粒子的適應度值,當粒子的當前適應度值大于粒子的歷史最佳適應度值時,用粒子的當前適應度值替換粒子的歷史最佳適應度值,并將粒子當前位置記錄為個體先前最優位置;當粒子的歷史最佳適應度值大于群體粒子的歷史最佳適應度值時,用粒子的歷史最佳適應度值替換群體粒子的歷史最佳適應度值,并將粒子當前位置記錄為全局先前最優位置; S324:更新粒子的速度和位置; S325:重復步驟S323-S324,直至迭代結束,輸出當前群體粒子的最佳適應度值,并根據當前群體粒子的最佳適應度值得出對抗樣本搜索空間中的最優對抗樣本; S33:利用改進的粒子群算法根據原始分詞無向圖中的節點與初始節點之間的路徑信息、以及對抗樣本類別標簽的置信度從對抗樣本搜索空間中計算得出最優對抗樣本; S4:將原始情感語句文本數據集和最優對抗樣本作為第二訓練樣本,對第一文本分類模型進行對抗訓練,得到第二文本分類模型; S5:獲取待分類的目標文本,將目標文本輸入第二分類模型進行分類,輸出分類結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人重慶郵電大學,其通訊地址為:400065 重慶市南岸區南山街道崇文路2號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。