江西理工大學(xué)毛伊敏獲國(guó)家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉江西理工大學(xué)申請(qǐng)的專利基于Spark并行頻繁項(xiàng)集挖掘方法獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN114138860B 。
龍圖騰網(wǎng)通過國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-19發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202111391423.7,技術(shù)領(lǐng)域涉及:G06F16/2458;該發(fā)明授權(quán)基于Spark并行頻繁項(xiàng)集挖掘方法是由毛伊敏;吳斌;許春冬設(shè)計(jì)研發(fā)完成,并于2021-11-23向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本基于Spark并行頻繁項(xiàng)集挖掘方法在說明書摘要公布了:本發(fā)明提出了一種基于Spark并行頻繁項(xiàng)集挖掘方法,包括以下步驟:S1,通過矩陣存儲(chǔ)獲取支持度計(jì)數(shù)矩陣,并提供創(chuàng)建條件FP?tree的支持度計(jì)數(shù)查詢;然后根據(jù)獲取的支持度計(jì)數(shù),剔除不滿足最小支持度的項(xiàng),得到頻繁1項(xiàng)集矩陣;然后通過非負(fù)矩陣分解策略SNMF分解儲(chǔ)存頻繁1項(xiàng)集的矩陣;S2,由S1的頻繁1項(xiàng)集矩陣可得頻繁1項(xiàng)集F?list,采用遺傳算法的分組策略GS?GA對(duì)S1得到的頻繁1項(xiàng)集均勻分組;S3,采用高效縮減樹結(jié)構(gòu)策略ERTS合并條件模式基,刪除FP?tree中不滿足最大頻繁項(xiàng)集的路徑;然后并行挖掘分組的FP?tree,獲得頻繁項(xiàng)集,并將結(jié)果輸出到分布式文件系統(tǒng)HDFS中。本發(fā)明解決了創(chuàng)建條件FP?tree的時(shí)空效率低,節(jié)點(diǎn)間的通信開銷大,冗余搜索的問題;在時(shí)空效率上和推薦非空率上都有顯著的提高。
本發(fā)明授權(quán)基于Spark并行頻繁項(xiàng)集挖掘方法在權(quán)利要求書中公布了:1.一種基于Spark并行頻繁項(xiàng)集挖掘方法,其特征在于,包括以下步驟: S1,通過矩陣存儲(chǔ)獲取支持度計(jì)數(shù)矩陣,并提供創(chuàng)建條件FP-tree的支持度計(jì)數(shù)查詢;然后根據(jù)獲取的支持度計(jì)數(shù),剔除不滿足最小支持度的項(xiàng),得到頻繁1項(xiàng)集矩陣;然后通過非負(fù)矩陣分解策略SNMF分解儲(chǔ)存頻繁1項(xiàng)集的矩陣; S1-1,支持度計(jì)數(shù)矩陣獲取:先從分布式文件系統(tǒng)HDFS中獲取數(shù)據(jù)庫(kù)信息,轉(zhuǎn)化為初始抽象彈性分布式數(shù)據(jù)集RDD,利用RDD的faltMap函數(shù)生成來自數(shù)據(jù)集的所有項(xiàng);接著在數(shù)據(jù)集的每個(gè)項(xiàng)上,應(yīng)用Map函數(shù)生成item,1鍵值對(duì);然后存儲(chǔ)每個(gè)事務(wù)中各個(gè)項(xiàng)兩兩組合的支持度計(jì)數(shù)于矩陣之中;最后使用reduceByKey來進(jìn)行支持度統(tǒng)計(jì),獲得支持度計(jì)數(shù)矩陣; S1-2,頻繁1項(xiàng)集矩陣獲?。焊鶕?jù)獲取的支持度計(jì)數(shù),剔除不滿足最小支持度的事務(wù),得到頻繁1項(xiàng)集,并更新矩陣的存儲(chǔ)信息,獲得頻繁1項(xiàng)集矩陣; S1-3,矩陣分解:采用非負(fù)矩陣分解函數(shù)FNMF分解頻繁1項(xiàng)集矩陣; 非負(fù)矩陣分解函數(shù)FNMF為: 其中V,W,H為非負(fù)矩陣;表示V屬于維度為a×b的非負(fù)矩陣,表示W(wǎng)屬于維度為a×c的非負(fù)矩陣,表示H屬于維度為c×b的非負(fù)矩陣;a、b、c表示矩陣維度; min表示取最小值; 為懲罰項(xiàng); ||·||F表示F范式; γ為稀疏參數(shù); ·T表示矩陣的轉(zhuǎn)置; S2,由S1的頻繁1項(xiàng)集矩陣可得頻繁1項(xiàng)集F-list,采用遺傳算法的分組策略GS-GA對(duì)S1得到的頻繁1項(xiàng)集均勻分組; S2-1,最優(yōu)解獲取:在獲取頻繁1項(xiàng)集F-list之后,先采用“高權(quán)二進(jìn)”編碼HWB,編碼轉(zhuǎn)換F-list,得到初始種群;然后采用個(gè)體適應(yīng)度計(jì)算公式FCIF,篩選初始種群,獲得下一代種群;最后,根據(jù)獲得的新的種群,遺傳變異種群,獲得最優(yōu)解; 所述“高權(quán)二進(jìn)”編碼HWB包括: 當(dāng)頻繁1項(xiàng)集為{X1,X2,...,Xn},Xk的支持度計(jì)數(shù)采用二進(jìn)制編碼時(shí),其正常編碼個(gè)體的概率為P=m+12mk,其中Xk為第k個(gè)正常編碼個(gè)體,k∈{1,2,...,n},m為各項(xiàng)集項(xiàng)的個(gè)數(shù),n表示頻繁1項(xiàng)集的項(xiàng)個(gè)數(shù)有n個(gè); 且二進(jìn)制整數(shù)各位的權(quán)重滿足其中為任意符號(hào),N*表示正整數(shù),為存在符號(hào); 所述體適應(yīng)度計(jì)算公式FCIF包括: 給定總集{x0,x1,...,xn},存在價(jià)值分別為{y0,y1,...,yn},種群容量為C,則個(gè)體適應(yīng)度為: 其中yi表示xi的存在價(jià)值; xi表示第i項(xiàng)集; 表示相關(guān)系數(shù), S2-2,頻繁1項(xiàng)集分組:獲得最優(yōu)解后,根據(jù)最優(yōu)解,分組頻繁1項(xiàng)集; 獲得最優(yōu)解后,根據(jù)最優(yōu)解的編碼信息對(duì)頻繁1項(xiàng)集F-list進(jìn)行分組,在完成n-1次分組時(shí),剩余個(gè)體自動(dòng)成為一組;獲得分組列表Group-list后,將得到的分組列表Group-list存儲(chǔ)到HDFS中,使得集群中任意節(jié)點(diǎn)都能訪問;其中n為頻繁1項(xiàng)集的總項(xiàng)數(shù); S3,采用高效縮減樹結(jié)構(gòu)策略ERTS合并條件模式基,刪除FP-tree中不滿足最大頻繁項(xiàng)集的路徑;然后并行挖掘分組的FP-tree,獲得頻繁項(xiàng)集,并將結(jié)果輸出到分布式文件系統(tǒng)HDFS中。
如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人江西理工大學(xué),其通訊地址為:341000 江西省贛州市章貢區(qū)紅旗大道86號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 中石化石油工程技術(shù)服務(wù)有限公司陳忠?guī)洬@國(guó)家專利權(quán)
- 深圳邁瑞生物醫(yī)療電子股份有限公司丁鐘奎獲國(guó)家專利權(quán)
- 弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)阿德里安·姆塔薩獲國(guó)家專利權(quán)
- 富士膠片株式會(huì)社河村大樹獲國(guó)家專利權(quán)
- 中山大學(xué)附屬第五醫(yī)院?jiǎn)硒櫕@國(guó)家專利權(quán)
- 英特爾公司G.R.默塔吉安獲國(guó)家專利權(quán)
- 聯(lián)想(北京)有限公司邵志強(qiáng)獲國(guó)家專利權(quán)
- 英特爾公司E.奧爾德-艾哈邁德-瓦爾獲國(guó)家專利權(quán)
- 青島海爾滾筒洗衣機(jī)有限公司徐安沅獲國(guó)家專利權(quán)
- 紫光同芯微電子有限公司蘇琳琳獲國(guó)家專利權(quán)


熱門推薦
- 上海聯(lián)影醫(yī)療科技股份有限公司張榮金獲國(guó)家專利權(quán)
- 深圳邁瑞生物醫(yī)療電子股份有限公司謝崇軍獲國(guó)家專利權(quán)
- 北京大學(xué)王蘇紅獲國(guó)家專利權(quán)
- 合肥疆程技術(shù)有限公司康棟獲國(guó)家專利權(quán)
- 福特全球技術(shù)公司阿里·納杰馬巴迪獲國(guó)家專利權(quán)
- 洛克利光子有限公司D.Y.伍獲國(guó)家專利權(quán)
- 福特全球技術(shù)公司威廉·??思{獲國(guó)家專利權(quán)
- 味之素株式會(huì)社鶴井一彥獲國(guó)家專利權(quán)
- 奧動(dòng)新能源汽車科技有限公司張建平獲國(guó)家專利權(quán)
- 詹姆斯·傅尼葉詹姆斯·傅尼葉獲國(guó)家專利權(quán)