大連理工大學金博獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉大連理工大學申請的專利知識智能分類方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117216268B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311094006.5,技術領域涉及:G06F16/353;該發明授權知識智能分類方法是由金博;邵明明設計研發完成,并于2023-08-29向國家知識產權局提交的專利申請。
本知識智能分類方法在說明書摘要公布了:本發明公開了一種知識智能分類方法,從外部知識源中檢索相關工藝知識圖譜的知識,將其中的概念信息作為一種知識,并將其整合到深度神經網絡中;為了評價知識的重要性,引入注意力機制,提出了可用于工藝知識圖譜的基于知識驅動數據分類方法。本發明利用概念對文本和概念對概念集的注意,從兩個方面獲取概念的權重;在概念信息的幫助下對知識進行分類。與傳統的方法不同,本發明的算法具有基于外部知識源做出決策的內在能力,并且更關注重要的知識。
本發明授權知識智能分類方法在權利要求書中公布了:1.一種知識智能分類方法,其特征在于,其包括: S1:獲取包含工藝知識圖譜的各類結構化和非結構化文件類型并提取所述文件中的詞; S2:使用連續詞袋模型將文本中的所有詞映射到高維向量空間,并得到目標詞的維度為D,具體包括以下步驟: S201:隨機初始化詞向量; S202:將所述文本中的上下文詞映射到詞向量; S203:對所述上下文詞向量求平均,得到上下文向量; S204:將所述上下文向量輸入至softmax層,計算詞匯表中每個詞的概率,所述softmax層計算公式為: 式中,xi為第i個上下文向量; S205:通過交叉熵損失函數更新詞向量,所述交叉熵損失函數的計算公式為: 式中,yi為第i個詞對應的標簽,為預測的第i個詞對應的標簽; S206:重復步驟S202-S205多次,直到模型收斂或達到預設的迭代次數; S207:輸出目標詞的詞向量,維度為D; S3:獲取知識庫的各類概念; S4:將所述知識庫概念輸入S2,并得到概念向量,維度為D; S5:使用卷積神經網絡CNN模型將文本中的所有詞映射到高維向量空間,并得到字符向量,維度為D; S6:將所述詞向量直接連接在字符向量后,拼接成維度為2D的向量,作為總詞向量; S7:將所述概念向量直接連接在字符向量后,拼接成維度為2D的向量,作為總概念向量; S8:計算所述總詞向量的文本表示,所述總詞向量可表示成x1,x2,…xn維度為2D的詞向量序列,n為總詞向量的長度,具體包括以下步驟: S801:將所述總詞向量xtt=1,…,n輸入到LSTM模型,得到一個隱藏狀態ht,隱單元數為u,所述LSTM計算公式如下: ht=LSTMxt,ht-1=ot·tanhCt 其中: ot表示t時刻輸出門的輸出,Wo表示輸出門權重,bo表示輸出門偏置,ft表示t時刻遺忘門的輸出,Wf表示遺忘門權重,bf表示遺忘門偏置,it表示t時刻輸入門的輸出,Wi表示遺忘門權重,bi表示遺忘門偏置,Ct表示LSTM中t時刻細胞層狀態,表示LSTM中t時刻細胞層中間狀態,WC表示細胞權重,bC表示遺忘門偏置; 最后得到所有的隱藏狀態的矩陣 S802:計算所述矩陣的注意力機制,最后得到輸出矩陣在這個矩陣中選擇最大的作為文本表示所述注意力機制計算公式如下: S9:計算概念對文本相關性層的注意力權重αi,給定一個大小為m的概念集C,其由概念向量組成,記為c1,c2,…,cm,其中ci為第i個概念向量; 式中,αi為第i個概念ci對文本q的注意力的權重;tanh為雙曲線正切變換函數,softmax用于歸一化每個概念的注意力權重,W1為權重矩陣,為權重矢量,b1為偏移量; S10:計算概念對概念集相關性層的注意力權重βi; 式中,βi為第i個概念ci在整個概念集合的注意力權重,W2為權重矩陣,為權重矢量,b2為偏移量; S11:計算概念對于文本的最終注意力權重ai; ai=softmaxγαi+1-γβi 式中,ai代表第i個概念對于文本的最終注意力權重;γ∈{0,1},其為用于調節兩者權重的“軟開關”,γ=σwT[α;β]+b,w和b為需要學習的參數,σ為sigmoid函數; S12:計算概念向量的加權和,從而得到表示概念的語義向量p; 式中,ci代表第i個概念,m代表共有m個概念; S13:將所述文本表示q與概念表示p拼接起來,得到input輸入; input=concatp,q S14:將所述input輸入通過全連接操作將關鍵特征表示從高維隱藏空間向量映射到低維標簽空間,其計算公式如下: output=softmaxfw3·input+b3 式中,w3為權重矢量,b3為偏移量,最后經過softmax分類器進行歸一化文本分類,獲取文本對應標簽結果; S15:將所述每個類別的標簽結果與實際標簽進行比較,基于損失函數計算出每個參數的梯度,然后通過梯度下降法迭代更新網絡參數,使損失函數最小化。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人大連理工大學,其通訊地址為:116024 遼寧省大連市甘井子區凌工路2號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。