北京羽樂創新科技有限公司樊巍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京羽樂創新科技有限公司申請的專利基于機器學習的號碼正確性評估方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119939193B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510415152.6,技術領域涉及:G06F18/21;該發明授權基于機器學習的號碼正確性評估方法及系統是由樊巍;薛勝光設計研發完成,并于2025-04-03向國家知識產權局提交的專利申請。
本基于機器學習的號碼正確性評估方法及系統在說明書摘要公布了:本申請提供一種基于機器學習的號碼正確性評估方法及系統。該方法包括:獲取號碼庫中號碼與的名稱對應樣本數據,對樣本數據進行篩選和標注處理,得到訓練數據集;根據訓練數據集,形成規范特征向量集合;利用規范特征向量集合,設定XGBoost模型的初始參數配置;依據特征重要性分析,從規范特征向量集合中篩選關鍵特征變量,利用篩選后的特征變量,對XGBoost模型進行訓練,獲得號碼正確性評估模型;采用號碼正確性評估模型,設定概率閾值;利用號碼正確性評估模型對號碼庫中的號碼進行預測,獲取預測概率值;將預測概率值與所述設定概率閾值進行比較,輸出號碼正確性評估結果。本申請顯著提高了號碼準確性評估的客觀性和精準度。
本發明授權基于機器學習的號碼正確性評估方法及系統在權利要求書中公布了:1.一種基于機器學習的號碼正確性評估方法,其特征在于,包括: 獲取號碼庫中號碼與的名稱對應樣本數據,對所述樣本數據進行篩選和標注處理,得到訓練數據集; 根據所述訓練數據集,形成規范特征向量集合; 利用所述規范特征向量集合,設定XGBoost模型的初始參數配置; 依據特征重要性分析,從規范特征向量集合中篩選關鍵特征變量,利用篩選后的特征變量,對所述XGBoost模型進行訓練,獲得號碼正確性評估模型; 采用所述號碼正確性評估模型,設定概率閾值; 利用所述號碼正確性評估模型對所述號碼庫中的號碼進行預測,獲取預測概率值; 將所述預測概率值與所述設定概率閾值進行比較,輸出號碼正確性評估結果; 其中,所述輸出號碼正確性評估結果之后,還包括: 針對連續型特征和分類型特征,分別構建針對所述號碼的特征距離計算矩陣,并設計對應的核函數,得到混合特征處理模型; 利用所述混合特征處理模型,處理所述訓練數據集,優化核函數參數,形成高斯過程模型; 從所述號碼正確性評估模型的預測結果中,選取預測概率值位于第一預設閾值和第二預設閾值之間的號碼樣本,并輸入所述高斯過程模型,計算預測不確定性指標,以識別需要人工驗證的號碼樣本; 其中,針對連續型特征和分類型特征分別構建針對所述號碼的特征距離計算矩陣,包括: 根據所述號碼的連續型特征,采用徑向基函數核計算特征間距離,形成連續特征距離矩陣,包括:對所述號碼的連續型特征進行預處理以消除量綱差異;計算任意兩個樣本在所述號碼的連續型特征上的歐幾里德距離,并通過RBF核函數將所述歐幾里德距離轉換為相似度度量;形成一個n×n的連續特征距離矩陣,其中n為樣本數; 根據所述號碼的分類型特征,采用Hamming距離核計算特征相異度,形成分類特征距離矩陣,包括:采用獨熱編碼One-HotEncoding將所述號碼的分類型特征轉換為二進制向量;對于任意兩個樣本的編碼后向量,計算它們的Hamming距離,即不同位的數量;對數據集中的所有樣本對計算它們在所述分類型特征上的相似度,形成分類特征距離矩陣; 將所述連續特征距離矩陣與所述分類特征距離矩陣進行加權組合,得到所述混合特征處理模型; 在所述輸出號碼正確性評估結果之后,還包括: 根據所述號碼正確性評估結果,針對號碼庫管理、數據清洗和推薦系統的應用需求進行場景化處理,輸出場景應用結果; 采集所述場景應用結果中的反饋數據和新增號碼樣本,更新所述號碼正確性評估模型,形成優化號碼正確性評估模型; 其中,所述更新所述號碼正確性評估模型,包括: 根據新增的反饋號碼樣本,采用恒定學習率的隨機梯度下降算法,對所述號碼正確性評估模型進行在線參數更新; 輸入與號碼關聯的文本描述信息、行業背景知識和歷史驗證記錄至大型語言模型,提取語義特征,生成非結構化特征向量; 將所述非結構化特征向量與號碼的原有特征進行融合,形成融合向量; 利用所述融合向量,更新所述號碼正確性評估模型,實現所述號碼正確性評估模型的迭代優化。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京羽樂創新科技有限公司,其通訊地址為:102200 北京市昌平區中關村科技園區昌平園超前路5號4幢2層220B;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。