蘇州市軟件評測中心有限公司徐剛獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉蘇州市軟件評測中心有限公司申請的專利一種基于AI的數據質量智能評估優化系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120410574B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510905764.3,技術領域涉及:G06Q30/018;該發明授權一種基于AI的數據質量智能評估優化系統是由徐剛;張征云;汪立翼設計研發完成,并于2025-07-02向國家知識產權局提交的專利申請。
本一種基于AI的數據質量智能評估優化系統在說明書摘要公布了:本申請提供一種基于AI的數據質量智能評估優化系統,包括:多源數據采集模塊用于采集多源數據,多源數據的來源包括數據庫、網絡接口和數據采集設備;多源數據整合模塊用于對多源數據進行結構化處理,處理為統一數據存儲格式的結構化數據;數據質量評估模塊內置基于深度學習的多維度數據質量評估模型,用于評估結構化數據的多維度質量評分,結構化數據的評估維度包括完整性、準確性、一致性、時效性;數據質量優化模塊用于基于多維度質量評分,分析結構化數據的數據質量問題并生成提示信息。本方案引入人工智能技術對數據質量進行智能評估優化,實現對數據質量的準確評估,顯著提升數據質量評估的可靠性和效率,為企業決策提供堅實的數據基礎。
本發明授權一種基于AI的數據質量智能評估優化系統在權利要求書中公布了:1.一種基于AI的數據質量智能評估優化系統,其特征在于,包括: 多源數據采集模塊,用于采集多源數據,其中,多源數據的來源包括數據庫、網絡接口和數據采集設備; 多源數據整合模塊,用于對多源數據進行結構化處理,處理為統一數據存儲格式的結構化數據; 數據質量評估模塊,內置基于深度學習的多維度數據質量評估模型,用于評估結構化數據的多維度質量評分,其中,結構化數據的評估維度包括完整性、準確性、一致性、時效性; 數據質量優化模塊,用于基于多維度質量評分,分析結構化數據存在的數據質量問題,并生成提示信息; 數據質量評估模塊中的多維度數據質量評估模型采用多任務學習框架,包括: 輸入層,用于接收輸入的結構化數據; 共享特征層,用于提取結構化數據的共享特征; 多任務評估層,包括完整性評估頭、準確性評估頭、一致性評估頭、時效性評估頭,完整性評估頭用于基于共享特征確定出結構化數據的完整性指數,準確性評估頭用于基于共享特征確定出結構化數據的準確性指數,一致性評估頭用于基于共享特征確定出結構化數據的一致性指數,時效性評估頭用于基于共享特征確定出結構化數據的時效性指數,其中,完整性指數反映結構化數據的字段缺失情況,準確性指數反映結構化數據的字段異常情況,一致性指數反映結構化數據的跨字段邏輯一致性情況,時效性指數反映結構化數據的數據延遲情況; 聚合層,用于基于結構化數據的完整性指數、準確性指數、一致性指數和時效性指數,確定出多維度質量評分; 輸出層,用于輸出結構化數據的多維度質量評分; 共享特征層,具體用于: 對結構化數據進行字段嵌入,得到統一維度的特征向量組,其中,字段嵌入形式包含數值型字段、類別型字段和時間型字段; 通過門控特征交叉網絡對特征向量進行特征交叉,得到交互特征向量; 對交互特征向量進行融合,生成共享特征; 共享特征層,具體用于: 針對結構化數據中的第個字段,: 若第個字段為數值型字段,采用以下方式進行嵌入: , 其中,表示結構化數據中第個字段是數值型字段時嵌入后的特征向量,表示第個字段的原始值,為第個字段的均值,為第個字段的標準差,為可學習的權重矩陣,維度為,為可學習的偏置向量,維度為; 若第個字段為類別型字段,采用以下方式進行嵌入: , 其中,表示結構化數據中第個字段是類別型字段時嵌入后的特征向量,表示第個字段的原始值,表示第個字段的one-hot編碼向量,表示可學習的嵌入矩陣,的行數等于第個字段的類別數,即的長度,的列數等于目標嵌入維度; 若第個字段為時間型字段,采用以下方式進行嵌入: , 其中,表示結構化數據中第個字段是時間型字段時嵌入后的特征向量,表示時間戳的數值表示,為時間周期,為可學習的權重矩陣,維度為; 對結構化數據的每個字段進行對應的字段嵌入后,得到一組特征向量,其中,為結構化數據中的字段總量; 共享特征層,具體用于: 通過門控特征交叉網絡對特征向量進行特征交叉: , 其中,表示第個字段的特征向量與第個字段的特征向量之間的交互特征向量,為Sigmoid激活函數,為可學習的權重矩陣,維度為,表示特征向量與特征向量的拼接,維度為,表示計算Hadamard積,為可學習的權重矩陣,維度為; 以及,基于每個字段的特征向量和每兩個特征向量之間的交互特征向量,生成共享特征: , 其中,為共享特征。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人蘇州市軟件評測中心有限公司,其通訊地址為:215100 江蘇省蘇州市蘇州工業園區金雞湖大道1355號國際科技園4F-2單元;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。