四川大學廖虎昌獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉四川大學申請的專利一種融合詞嵌入關鍵詞提取和基于深度學習的情感分析的在線評論多屬性決策方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117521637B 。
龍圖騰網通過國家知識產權局官網在2025-09-05發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311284490.8,技術領域涉及:G06F40/211;該發明授權一種融合詞嵌入關鍵詞提取和基于深度學習的情感分析的在線評論多屬性決策方法是由廖虎昌;楊珊珊設計研發完成,并于2023-10-07向國家知識產權局提交的專利申請。
本一種融合詞嵌入關鍵詞提取和基于深度學習的情感分析的在線評論多屬性決策方法在說明書摘要公布了:本發明公開了一種融合詞嵌入關鍵詞提取和基于深度學習的情感分析的在線評論多屬性決策方法,包括步驟:1確定屬性和關鍵詞;2基于Vader和MHA?BiLSTM模型的情感分析方法;3情感分類預測;4屬性權重確定;5方案排序,與現有技術相比,本發明解決了:1.在屬性已知的情況下,如何基于詞嵌入模型和相似度計算找到特定領域下如酒店或電商產品各屬性最相關的關鍵詞;2.情感分析過程中人工標注困難以及無法識別多層次、多角度語義關系的問題;3.如何從在線評論中提取客觀屬性權重,以及從潛在消費者的偏好信息中提取主觀屬性權重的問題。
本發明授權一種融合詞嵌入關鍵詞提取和基于深度學習的情感分析的在線評論多屬性決策方法在權利要求書中公布了:1.一種融合詞嵌入關鍵詞提取和基于深度學習的情感分析的在線評論多屬性決策方法,其特征在于,包括如下步驟: 1確定屬性和關鍵詞 首先進行情感短語提取,提取情感短語的目的是獲取消費者表達過情感的關鍵詞,通過分析文本的依存句法結構,運用Python包spacy分析詞語之間的依存句法關系,當前單詞是名詞,則搜索當前單詞的左側,如果左側單詞是形容詞修飾語,則提取形容詞和名詞的情感短語,如果當前單詞是動詞,則查找當前單詞的右側;如果右側單詞是動詞的狀語修飾語,則構成動詞和狀語短語,按照相同的規則查找當前單詞的左側,如果名詞、助動詞、形容詞與連詞的組合時,則從助動詞開始,分別從左右搜索,得到形容詞和名詞的短語,如果存在連詞,就會得到多組情感短語; 從情感短語中提取高頻詞作為候選關鍵詞,基于Glove模型和相似度計算,從高頻數據集中確定各屬性下的關鍵詞;如公式1所示,在高頻數據集中,βj表示第jth個屬性的詞向量,βθ表示高頻詞數據集中第θth個詞匯的詞向量,表示高頻詞的個數,我們選擇與每個屬性相似程度最高的單詞作為該屬性的關鍵詞; 2基于Vader和MHA-BiLSTM模型的情感分析方法 在確定了屬性和相應的關鍵詞后,采用Vader和MHA-BiLSTM相結合的情感分析方法來分析包含這些關鍵詞的句子的情感; 首先,從評論中刪除日期、時間、地址和標點符號,并將單詞轉換為小寫,接下來,對句子進行分詞,將每個句子劃分為單詞,然后,刪除經常使用但毫無意義的停用詞; 采用Vader分析訓練數據集并生成情感分數,根據復合得分,細粒度情感極性由公式2確定; 然后運用MHA-BiLSTM模型對基于Vader標記的數據集進行多標簽情感分類,在BiLSTM完成上下文語義特征提取后,MHA和BiLSTM的結合旨在通過MHA機制分配權重來突出關鍵特征,該模型由嵌入層、雙向LSTM層、MHA層、全連接層和輸出層組成,首先,嵌入層通過Glove模型將句子映射為詞向量,然后,雙向LSTM層將詞向量轉換為高維特征向量,這一層通過前向和后向學習文本中的語義關系,接著,MHA層生成注意權重矩陣,利用注意度對BiLSTM輸出向量進行加權,從不同的角度增強對重要特征的關注,提高分類的準確性,全連接層使用校正的線性單元Relu作為激活函數來對高維特征降維,并將其傳遞給輸出Softmax層,最后,輸出層預測輸入數據的標簽,運用Softmax函數實現多分類任務,Softmax層將根據類別數輸出多個概率值,概率值越高,屬于相應類別的可能性越大; 3情感分類預測 利用訓練后的MHA-BiLSTM模型對未標記數據集進行情感預測,MHA-BiLSTM模型的輸出分別表示句子屬于“非常消極”“消極”“中性”“積極”和“非常積極”的概率,概率最大的類別是句子的情感分類,然后,將所有標記好的數據集作為原始數據集,用于識別關于各屬性的情感; 首先,確定每個句子中包含的關鍵詞和對應的屬性,然后,根據MHA-BiLSTM的分類結果確定句子的情感,接著計算各屬性下每種情感的頻率分布,情感表達為語言術語,頻率表示為概率,采用語言術語集{s-2=verynegative,s-1=negative,s0=neutral,s1=positive,s2=verypositive}來描述消費者群體的意見,情感分析的結果被表示為其中代表方案u在屬性j下的情感類別r,p*r表示屬于情感類別r的概率,最后將每個方案下的概率語言術語作為評價信息輸入到決策方法中; 4屬性權重確定 屬性的客觀權重與相應關鍵詞的表現密切相關,關鍵字的頻率越高,說明相應的屬性被提及的頻率越高,這表明消費者群體對該屬性的重視程度更高,從這個意義上講,第j個屬性的客觀權重由公式3確定,其中,ηkj表示jth屬性下的kth關鍵詞被不同的詞修飾的數量占所有關鍵詞被不同的詞修飾的數量的比率,q表示第j個屬性下的關鍵詞個數, 接下來確定主觀權重,潛在客戶主觀地評估屬性的重要性,并生成關于屬性重要性的成對比較矩陣,采用BWM方法計算主觀權重,計算屬性主觀權重的步驟如下:第一,潛在客戶確定最佳屬性cB和最差屬性cW,然后,確定最佳屬性比其他屬性的偏好度lBj∈{1,2,…,9}j=1,2,...n,其中不同的數字代表不同的重要級別,同樣,確定其他屬性相對于最差屬性的偏好度ljW∈{1,2,…,9} j=1,2,...n,通過求解模型1求出主觀屬性權重wj sj=1,2,...n; 模型1 minξ s.t. |wB s-lBjwj s|≤ξwj s |wj s-ljWwW s|≤ξwW s wj s≥0 采用一致性指標來衡量成對比較的可靠性,通過將lBW∈{1,2...9}引入公式4,可以得到不同lBW下的一致性指標,在此基礎上,利用公式5求出一致性比率,將主觀權重和客觀權重結合起來,通過公式6求出屬性的最終權重, ξ2-2lBW+1ξ+lBW 2-lBW=04 5方案排序 假設對備選方案u和備選方案v的評價被分別表示為和設: 其中,F為語義標度函數,是備選方案u和備選方案v之間的正向語義差異,αujr和αvjr是和的下標,則au在屬性cj下相對于av的優勢可以被表示為: 在此基礎上,利用公式9對優勢進行歸一化處理,au在屬性cj下的獲得優勢分數通過公式10獲得,凈獲得優勢得分通過公式11獲得,損失優勢分數被表示為公式12,凈損失優勢分數用公式13來計算, 在此基礎上,得到基于DS1au的降序集R1={ra1a1,ra1a2,...ra1am}和基于DS2au升序集R2={ra2a1,ra2a2,...ra2am},然后,運用公式14對DS1au和DS2au歸一化處理,根據兩個等級集和優勢分數,通過公式15計算集體得分,最后的排序R={raa1,raa2,...raam}由BSauu=1,2,...m的降序排列得到,
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人四川大學,其通訊地址為:610065 四川省成都市武侯區一環路南一段24號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。