北京印刷學院肖克晶獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京印刷學院申請的專利融合優化預訓練模型與圖卷積網絡模型的文本分類方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN118862880B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202410941327.2,技術領域涉及:G06F40/284;該發明授權融合優化預訓練模型與圖卷積網絡模型的文本分類方法是由肖克晶;劉琪;冉廣煜;曹少中設計研發完成,并于2024-07-15向國家知識產權局提交的專利申請。
本融合優化預訓練模型與圖卷積網絡模型的文本分類方法在說明書摘要公布了:本發明公布了一種融合優化預訓練模型與圖卷積網絡模型的文本分類方法,涉及自然語言處理技術領域;分別通過進行特征插值的優化的預訓練模型和通過設計尺度融合機制的圖卷積網絡模型提取文本特征并進行分類預測,再將兩種預測結果進行加權融合,實現高效的文本分類。利用本發明提供的更為全面的文本分類技術,能夠有效地提升文本分類的準確度,可廣泛應用于多個領域。
本發明授權融合優化預訓練模型與圖卷積網絡模型的文本分類方法在權利要求書中公布了:1.一種融合優化預訓練模型與圖卷積網絡模型的文本分類方法,其特征在于,分別通過進行特征插值優化預訓練模型和通過設計尺度融合機制的圖卷積網絡模型提取文本特征并進行預測,再將兩種預測結果進行加權融合,實現高效的文本分類;所述方法包括如下步驟: 1根據文本數據集中的文檔和單詞的相關度構建文本數據集對應的異構圖;異構圖的節點表示文檔或單詞的特征表示,異構圖的邊權重代表文檔與單詞之間或單詞與單詞之間的相關度;將異構圖所有邊的信息存入鄰接矩陣中; 2通過優化預訓練模型提取文本數據的特征表示并得到預測結果;包括: 對原始文本數據樣本進行數據增強,生成兩個數據增強樣本; 將原始樣本和兩個增強樣本輸入預訓練模型,得到文本序列;并在每個文本序列對應位置添加文本序列分類標記; 批量加載原始樣本和增強樣本并輸入到預訓練模型中進行特征提取和傳播;在特征提取和傳播的過程中:從預訓練模型的所有層中隨機選擇兩層進行特征插值;在第一層中,將原始樣本和第一個增強樣本傳播得到的隱藏狀態進行加權混合;第二層中,將原始樣本和第二個增強樣本傳播得到的隱藏狀態進行加權混合;兩次插值操作得到的結果均作為原始樣本的隱藏狀態在模型的每一層中繼續傳播,使得預訓練模型學習不同特征的組合;再將預訓練模型最后一層的隱藏狀態作為最終提取的特征表示并輸出; 將異構圖的節點特征賦值為優化后預訓練模型的輸出特征; 優化后的預訓練模型的輸出特征經Softmax分類層處理,輸出為每個文本類別的概率,即預測結果; 3基于圖卷積網絡模型進行特征提取和傳播: 將異構圖的節點特征和鄰接矩陣分批傳入改進的深層的圖卷積網絡模型;節點特征通過模型的一系列卷積層進行傳播和變換,每一層均利用殘差連接和恒等映射更新節點特征; 設計新的特征尺度融合機制,在特征進行傳播和變換的過程中,通過特征尺度融合機制進行特征提?。辉诿恳痪矸e層中進行多個卷積操作,每個卷積操作使用不同冪次的鄰接矩陣提取不同尺度的特征;再將不同尺度的特征進行加權求和; 將最后一個輸出層的特征表示作為最終提取的特征輸入到Softmax分類層中處理,輸出每個類別的概率,即預測結果; 4將兩種預測結果進行加權融合,得到最終的文本分類結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京印刷學院,其通訊地址為:102600 北京市大興區興華大街(二段)1號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。