廣州市普澤電子科技有限公司周偉光獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉廣州市普澤電子科技有限公司申請的專利一種基于大數(shù)據(jù)的網(wǎng)絡行為分析方法獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN119254817B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-09-05發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202411275592.8,技術領域涉及:H04L67/1396;該發(fā)明授權一種基于大數(shù)據(jù)的網(wǎng)絡行為分析方法是由周偉光設計研發(fā)完成,并于2024-09-12向國家知識產(chǎn)權局提交的專利申請。
本一種基于大數(shù)據(jù)的網(wǎng)絡行為分析方法在說明書摘要公布了:本發(fā)明公開了一種基于大數(shù)據(jù)的網(wǎng)絡行為分析方法,涉及大數(shù)據(jù)處理技術領域。本發(fā)明利用服務器獲取用戶行為數(shù)據(jù),進行識別用戶,根據(jù)用戶訪問生成有用軌跡段;進行頻繁序列挖掘,獲得用戶頻繁行為序列,將頻繁行為序列作為用戶特征,區(qū)分用戶的異常行為與正常行為,將得到的異常行為數(shù)據(jù)抽象成標簽,構建用戶畫像模型,建立異常行為模式特征庫,將待測用戶行為序列與異常行為模式特征庫進行匹配,通過匹配是否成功來判斷是否為異常用戶,并據(jù)此提取用戶行為數(shù)據(jù)異常特征。本發(fā)明完成對用戶行為數(shù)據(jù)異常特征的判斷及提取,提高了用戶行為數(shù)據(jù)異常檢測的精度,并對檢測精度進行評級。
本發(fā)明授權一種基于大數(shù)據(jù)的網(wǎng)絡行為分析方法在權利要求書中公布了:1.一種基于大數(shù)據(jù)的網(wǎng)絡行為分析方法,其特征在于,流程如下: 步驟一、獲取用戶行為數(shù)據(jù),識別用戶,根據(jù)用戶訪問生成有用軌跡段;用戶數(shù)據(jù)包括用戶身份、訪問日期、訪問路徑、訪問內(nèi)容、請求結果和瀏覽時間; 步驟二、將有用軌跡段分割為不同區(qū)域后,進行頻繁序列挖掘,輸出用戶頻繁行為序列及其支持度,將頻繁行為序列作為用戶特征,并賦予權重; 步驟三、區(qū)分用戶的異常行為與正常行為,將得到的異常行為數(shù)據(jù)抽象成標簽; 步驟四、構建用戶畫像模型; 步驟五、建立異常行為模式特征庫,將待測用戶行為序列與異常行為模式特征庫進行匹配,判斷是否為異常用戶; 步驟六、對異常用戶進行異常行為特征提取,將提取用戶異常行為的精度進行量化,完成對異常用戶的異常行為特征的分析; 所述步驟一具體如下: 通過web服務器產(chǎn)生的日志文件獲取用戶行為數(shù)據(jù); 將用戶行為數(shù)據(jù)進行用戶識別,過程如下: 當IP地址不同時,代表多個不同用戶; 當IP地址相同,并且用戶使用的操作系統(tǒng)和瀏覽器相同時,代表同一用戶; 當IP地址相同,但用戶使用的操作系統(tǒng)和瀏覽器不同時,代表多個不同用戶; 當用戶請求訪問的某個頁面與之前訪問的任一頁面均不相關時,代表出現(xiàn)一個新用戶; 當用戶請求訪問的某個頁面之前從未訪問過,且在日志記錄中未有引用痕跡時,代表出現(xiàn)一個新用戶; 將用戶的訪問分解成軌跡段,用以下形式表示: R=U,{Pi,Ti,…,Pk,Tk}; 其中,R表示用戶在一段時間內(nèi)請求的頁面的集合序列;U表示用戶標識;P表示用戶請求的頁面的標識符;T表示時間; 設置用戶相鄰請求之間的超時時間閾值為θ,判斷是否滿足Ti-Ti-1≤Q…1≤iQ,若滿足,則標記該軌跡為有用軌跡段; 所述步驟二具體如下: 對有用軌跡段按照時間順序進行排序,獲得用戶行為數(shù)據(jù)序列Y,并構建用戶行為序列數(shù)據(jù)庫,用戶每個行為節(jié)點在序列中都有其對應的位置,用戶行為序列表示一個用戶在某時間戳內(nèi)的操作; 用戶行為數(shù)據(jù)序列Y=y(tǒng)1,y2,y3,y4,...,ym,其中,m為正整數(shù),對序列中的每個行為xm創(chuàng)建一個其對應的點,并添加對應的行為標識符、時間戳和頁面ID,使用時間戳對創(chuàng)建的點進行排序,獲得用戶行為數(shù)據(jù)序列點集合X=x1,x2,x3,x4,...,xm,其中,m為正整數(shù); 將空間內(nèi)任意一點xm作為圓心,設置半徑為r,形成圓形區(qū)域,將此圓形區(qū)域內(nèi)的所有點的集合標記為鄰域Brxm, Brxm={xn∈D│distxm,xn≤r}; 其中,distxm,xn表示xm和xn之間的距離; 將鄰域內(nèi)樣本個數(shù)的最小值標記為MinPts; 從數(shù)據(jù)集X中隨機挑選一個點xm,判斷|Brxm|是否大于等于MinPts,當|Brxm|≥MinPts,則判定xm為核心對象,加入核心集合Y中; 從核心集合Y中隨機挑選一個核心對象xn,將其密度可達的所有點,加入新的集合C1,形成第一個聚類簇; 繼續(xù)訪問數(shù)據(jù)集X中的下一個點,重復上述步驟,直到處理完數(shù)據(jù)集中的所有點,得到聚類簇Cm,將沒有包含在聚類簇中的點標記為噪音,予以刪除; 聚類簇Cm包括用戶基本屬性、職位屬性、業(yè)務屬性、時間屬性和空間屬性;其中,基本屬性包括用戶ID和IP地址;職位屬性包括用戶具有的職位級別;業(yè)務屬性是用戶所具有的業(yè)務功能;時間屬性是用戶訪問在時間上的分段;空間屬性是用戶訪問在區(qū)域上的分段; 利用Apriori算法對區(qū)域分割處理后的數(shù)據(jù)進行頻繁行為序列挖掘處理,輸出用戶行為序列及其支持度;設置支持度閾值為ρ,剔除低于支持度閾值ρ的行為序列,保留高于支持度閾值ρ的行為序列及其支持度,并將其標記為頻繁行為序列; 將頻繁行為序列作為用戶特征,每個用戶特征代表一個特定的用戶行為模式,包括多個用戶行為步驟;為每個用戶特征賦予權重。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或專利權人廣州市普澤電子科技有限公司,其通訊地址為:511400 廣東省廣州市番禺區(qū)大龍街竹山村竹山工業(yè)路8號301;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。