杭州電子科技大學袁理鋒獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉杭州電子科技大學申請的專利基于屬性關聯性的時序記錄鏈接數據匹配方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116680325B 。
龍圖騰網通過國家知識產權局官網在2025-09-05發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310747487.9,技術領域涉及:G06F16/2458;該發明授權基于屬性關聯性的時序記錄鏈接數據匹配方法及裝置是由袁理鋒;駱鑫輝;任一支;殷為鋒;王冬設計研發完成,并于2023-06-25向國家知識產權局提交的專利申請。
本基于屬性關聯性的時序記錄鏈接數據匹配方法及裝置在說明書摘要公布了:本發明公開了基于屬性關聯性的時序記錄鏈接數據匹配方法及裝置,該方法首先進行數據預處理,對每個參與鏈接的數據源數據及用于訓練時間關聯模型的數據進行清洗。其次進行時間關聯模型訓練,通過學習訓練出預測每個鏈接屬性隨時間變化概率的模型。最后進行數據鏈接實現對來自多個數據源數據的實體識別。該裝置包括數據預處理模塊、訓練模塊和鏈接模塊。本發明能準確預測實體屬性隨時間變化的概率,來調整屬性之間的相似性,并顯著提高了鏈接時間記錄的準確率,具有普適性以及可擴展性。
本發明授權基于屬性關聯性的時序記錄鏈接數據匹配方法及裝置在權利要求書中公布了:1.基于屬性關聯性的時序記錄鏈接數據匹配方法,其特征在于,包括如下步驟: S1數據預處理,對每個參與鏈接的數據源數據及用于訓練時間關聯模型的數據進行清洗; S2時間關聯模型訓練,通過學習訓練出預測每個鏈接屬性隨時間變化概率的模型;具體過程為: S2.1.1為每條記錄分配一個唯一的實體標識符,訓練數據R中每條訓練數據表示為ri,rj,ri,rj表示從訓練數據中任意選取的兩條記錄,其標識符分別為i和j,其中i≠j;同時,記A為用于鏈接屬性集合,鏈接屬性為能夠區分實體的屬性,則對于每條訓練數據ri,rj,從A中依次選取鏈接屬性{A1,A2,…,An},記所選屬性為Ak∈A,k∈{1,2,...,n},計算其相對于A的補集并選擇集合中的屬性作為Ak的關聯屬性;然后,計算鏈接屬性Ak的關聯屬性關于時間的狀態值集合: 其中,表示ri和rj對應屬性An的值是否相同,其計算值為: 其中,sim用于計算記錄i和j屬性An值的相似性,α為設置的閾值; S2.1.2將鏈接屬性Ak隨時間變化的情況分為三類:兩條記錄屬于同一實體,并且鏈接屬性Ak未發生變化;兩條記錄屬于同一實體,并且鏈接屬性Ak發生變化;兩條屬性不屬于同一實體;將鏈接屬性Ak的類別標簽記為計算: S2.1.3生成一條關于鏈接屬性Ak的訓練數據l:存入哈希表R′[Ak]中,得到新的訓練數據集合R′; S2.1.4重復步驟S2.1.1至S2.1.3,直至S2.1.1中所有鏈接屬性對應的訓練數據生成完畢; S2.2.1對R′進行關聯規則挖掘,記X和Y為兩個不同的事件,D為所有事件的總數,countofX為事件X出現的次數,SupportX表示事件X出現的概率,其計算公式為: ConfidenceX|Y表示事件X發生時,Y同時發生的概率,其計算公式為: S2.2.2對于每個鏈接屬性Ak∈A,R′[Ak]中每條訓練數據l表示為根據類別標簽分別統計鏈接屬性Ak的所有變化情況和鏈接屬性Ak發生改變的情況的出現次數和 計算和調整時間關聯性的強度;使用計算結果將R′[Ak]中每條訓練數據l更新為: S2.3.1分別對S2.1.2所描述的三個類別構建模型;對于每個類別,使用XGBoost算法分輪次進行訓練,每輪構建一個回歸樹分類器,下一輪回歸樹在上一輪回歸樹的基礎上再學習;每棵樹的輸出為當前類別的得分,并將所有樹得分加在一起作為當前類別的最終得分; S2.3.2使用Z表示類別,zi表示第i個類別的最終得分,m表示類別總數,經過SoftMax函數,得到A2中每個類別的預測概率,其中第一類的概率用C≠表示,是屬性表示同一實體,并且隨時間發生改變的概率;第二類的概率用C=表示,是屬性表示同一實體,并且隨時間保持不變的概率;第三類的概率為1-C≠-C=,是屬性表示不同實體的概率; S3數據鏈接實現對來自多個數據源數據的實體識別,具體過程為: S3.1接收經過預處理得到的數據源數據,并對數據進行聚類,生成多個包含候選記錄的簇;同時,接收經過預處理得到的訓練數據,并進行信息抽取和關聯規則挖掘,構建屬性的時間關聯模型; S3.2計算候選記錄對的相似度,使用時間關聯模型為屬性分配權重,根據權重調整相似度,生成匹配結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州電子科技大學,其通訊地址為:310018 浙江省杭州市錢塘區白楊街道2號大街1158號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。