成都數(shù)據(jù)集團(tuán)股份有限公司鄧建平獲國(guó)家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉成都數(shù)據(jù)集團(tuán)股份有限公司申請(qǐng)的專利一種適用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)處理方法及系統(tǒng)獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN120234545B 。
龍圖騰網(wǎng)通過(guò)國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-08-26發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202510694210.3,技術(shù)領(lǐng)域涉及:G06F18/15;該發(fā)明授權(quán)一種適用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)處理方法及系統(tǒng)是由鄧建平;詹國(guó)林;伍勇波;馬永華設(shè)計(jì)研發(fā)完成,并于2025-05-28向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種適用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)處理方法及系統(tǒng)在說(shuō)明書摘要公布了:本發(fā)明公開了一種適用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)處理方法及系統(tǒng),涉及數(shù)據(jù)預(yù)處理技術(shù)領(lǐng)域。包括通過(guò)大數(shù)據(jù)收集原始數(shù)據(jù);使用動(dòng)態(tài)相關(guān)性補(bǔ)充方法計(jì)算補(bǔ)充值,對(duì)數(shù)據(jù)的缺失特征值進(jìn)行補(bǔ)充,對(duì)缺失特征值的補(bǔ)充更加符合數(shù)據(jù)的整體趨勢(shì),提高補(bǔ)充值準(zhǔn)確性;通過(guò)可靠性常數(shù)計(jì)算方法獲取不同來(lái)源的可靠性常數(shù),對(duì)不同來(lái)源的數(shù)據(jù)進(jìn)行不同比例的抽取;將數(shù)據(jù)進(jìn)行合并、統(tǒng)一和歸一化處理。本發(fā)明通過(guò)動(dòng)態(tài)相關(guān)性補(bǔ)充方法計(jì)算補(bǔ)充值,對(duì)數(shù)據(jù)的缺失特征值進(jìn)行補(bǔ)充,根據(jù)數(shù)據(jù)的其他特征值與缺失特征值的相關(guān)性,確定其他特征值對(duì)缺失特征值的相關(guān)權(quán)重,相關(guān)性呈動(dòng)態(tài)變化,對(duì)缺失特征值的補(bǔ)充更加符合數(shù)據(jù)的整體趨勢(shì),提高補(bǔ)充值準(zhǔn)確性。
本發(fā)明授權(quán)一種適用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)處理方法及系統(tǒng)在權(quán)利要求書中公布了:1.一種適用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)處理方法,其特征在于:包括: 通過(guò)大數(shù)據(jù)收集相關(guān)原始數(shù)據(jù),并記錄數(shù)據(jù)來(lái)源; 原始數(shù)據(jù)進(jìn)行去重后,使用動(dòng)態(tài)相關(guān)性補(bǔ)充方法計(jì)算補(bǔ)充值,對(duì)數(shù)據(jù)的缺失特征值進(jìn)行補(bǔ)充; 通過(guò)可靠性常數(shù)計(jì)算方法獲取不同來(lái)源的可靠性常數(shù),根據(jù)不同來(lái)源的數(shù)據(jù)可靠性常數(shù),對(duì)不同來(lái)源的數(shù)據(jù)進(jìn)行不同比例的抽取; 將來(lái)自不同來(lái)源、不同格式的數(shù)據(jù)進(jìn)行合并和統(tǒng)一處理,對(duì)數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換、編碼統(tǒng)一操作,使數(shù)據(jù)在結(jié)構(gòu)和語(yǔ)義上保持一致; 將集成后的數(shù)據(jù)進(jìn)行歸一化處理,使數(shù)據(jù)具有相同的尺度和分布; 所述動(dòng)態(tài)相關(guān)性補(bǔ)充方法包括: S1:根據(jù)數(shù)據(jù)的其余特征值計(jì)算每個(gè)特征值對(duì)缺失特征值的相關(guān)系數(shù),依據(jù)公式: , 為獲取的數(shù)據(jù)中的樣本數(shù)量,其中為第j個(gè)特征和第k個(gè)特征之間的相關(guān)系數(shù),為第i個(gè)樣本的第j個(gè)特征的特征值,為n個(gè)樣本中第j個(gè)特征的均值,為第i個(gè)樣本的第k個(gè)特征的特征值,為n個(gè)樣本中第k個(gè)特征的均值; S2:根據(jù)相關(guān)系數(shù)確定其他特征與缺失特征之間的相關(guān)權(quán)重,根據(jù)公式: , 其中為表示第k個(gè)特征對(duì)于填補(bǔ)第j個(gè)特征缺失值的相關(guān)權(quán)重,為每個(gè)樣本的特征數(shù)量; S3:根據(jù)歷史數(shù)據(jù)獲取擬合的線性關(guān)系并計(jì)算相關(guān)補(bǔ)充值,依據(jù)公式: , , 其中為因變特征值,為截距項(xiàng),代表第k個(gè)特征的特征值,為特征k的回歸系數(shù),為誤差項(xiàng),為樣本i中第j個(gè)特征的相關(guān)補(bǔ)充值,為第i個(gè)樣本的第k個(gè)特征的特征值; S4:使用的值對(duì)樣本i中第j個(gè)特征進(jìn)行補(bǔ)充。
如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人成都數(shù)據(jù)集團(tuán)股份有限公司,其通訊地址為:610000 四川省成都市高新區(qū)吉瑞四路399號(hào)1棟8樓5、6號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 微軟技術(shù)許可有限責(zé)任公司M·A·馬林獲國(guó)家專利權(quán)
- 株式會(huì)社可樂(lè)麗岡本哲彌獲國(guó)家專利權(quán)
- 弗門尼舍有限公司M·德拉特利獲國(guó)家專利權(quán)
- 兄弟工業(yè)株式會(huì)社柴田武志獲國(guó)家專利權(quán)
- 德克斯康公司R·E·斯庫(kù)恩馬克獲國(guó)家專利權(quán)
- 德雷塞爾大學(xué)蒂莫西·M·布勒克獲國(guó)家專利權(quán)
- 開易(廣東)服裝配件有限公司陳昌華獲國(guó)家專利權(quán)
- 谷歌有限責(zé)任公司馬里厄斯·席爾德獲國(guó)家專利權(quán)
- 晶元光電股份有限公司林羿宏獲國(guó)家專利權(quán)
- 英特爾公司T·T·施呂斯列爾獲國(guó)家專利權(quán)


熱門推薦
- 深圳市贏合科技股份有限公司黃振奎獲國(guó)家專利權(quán)
- 英特爾公司N.K.托馬斯獲國(guó)家專利權(quán)
- 杭州諾茂醫(yī)療科技有限公司王永勝獲國(guó)家專利權(quán)
- 華為技術(shù)有限公司諸華林獲國(guó)家專利權(quán)
- 浙江蘇泊爾家電制造有限公司陽(yáng)夢(mèng)喬獲國(guó)家專利權(quán)
- 福特全球技術(shù)公司馬克·席爾瓦·康德拉德獲國(guó)家專利權(quán)
- 八樂(lè)夢(mèng)床業(yè)株式會(huì)社細(xì)川雄史獲國(guó)家專利權(quán)
- 華榮科技股份有限公司李江獲國(guó)家專利權(quán)
- 江蘇宇通干燥工程有限公司陸文光獲國(guó)家專利權(quán)
- ZF主動(dòng)安全有限公司A·呂德爾獲國(guó)家專利權(quán)