福建電子口岸股份有限公司林鎧欣獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉福建電子口岸股份有限公司申請的專利基于非平衡集成學習的報關單預判模型訓練方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115860147B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210109232.5,技術領域涉及:G06N20/20;該發明授權基于非平衡集成學習的報關單預判模型訓練方法及裝置是由林鎧欣;王良;張榮杰;劉鍵濤;魏秋新設計研發完成,并于2022-01-28向國家知識產權局提交的專利申請。
本基于非平衡集成學習的報關單預判模型訓練方法及裝置在說明書摘要公布了:本發明公開了一種基于非平衡集成學習的報關單預判模型訓練方法及裝置,通過收集歷史報關單數據,得到樣本數據,對樣本數據采用分層隨機抽樣方式進行分割,得到訓練集和測試集;構建報關單預判模型,報關單預判模型為采用加權交叉熵損失函數的Xgboost模型,加權交叉熵損失函數包括乘數加權交叉熵損失函數、聚焦損失交叉熵損失函數和梯度均衡交叉熵損失函數中的其中一種;根據訓練集訓練報關單預判模型,在訓練過程中調整報關單預判模型中的樣本權重,樣本權重為初始權重和時間價值權重的乘積,根據測試集測試經過訓練的報關單預判模型,確定調整的網絡模型參數和加權交叉熵損失函數。該方法明顯加強模型對于報關單風險的學習能力,有效提高查驗有效率。
本發明授權基于非平衡集成學習的報關單預判模型訓練方法及裝置在權利要求書中公布了:1.一種基于非平衡集成學習的報關單預判模型訓練方法,其特征在于,包括以下步驟: S1,收集歷史報關單數據,并標注樣本類別作為標簽,將所述歷史報關單數據進行特征工程處理,得到特征數據,將所述特征數據進行特征編碼,得到樣本數據,對所述樣本數據采用分層隨機抽樣方式進行分割,得到訓練集和測試集; S2,構建報關單預判模型,所述報關單預判模型為采用加權交叉熵損失函數的Xgboost模型,所述加權交叉熵損失函數包括乘數加權交叉熵損失函數、聚焦損失交叉熵損失函數和梯度均衡交叉熵損失函數中的其中一種;乘數加權交叉熵損失函數表示為: 其中,yi表示樣本數據i的類別,yi=1表示樣本為黑名單,yi=0表示樣本為白名單,m為樣本數據的總數,表示樣本數據i為黑名單的預測概率值,α表示乘數系數; 聚焦損失交叉熵損失函數表示為: 其中,γ表示指數系數; 梯度均衡交叉熵損失函數表示為: 其中,pi表示樣本數據i為黑名單的預測概率值,β通過每個樣本數據i的梯度密度求得,β的計算公式如下: 其中,GDgi為梯度密度,梯度密度通過預測概率值pi與實際值pi *差值的絕對值|pi-pi *|計算得到; S3,根據所述訓練集訓練所述報關單預判模型,在訓練過程中調整所述報關單預判模型中的樣本權重,所述樣本權重為初始權重和時間價值權重的乘積,所述初始權重根據樣本類別設置,所述時間價值權重根據所述歷史報關單數據發生時間與訓練時間的距離長短設置; S4,根據所述測試集測試經過訓練的所述報關單預判模型,基于經過訓練的所述報關單預判模型符合預設要求,確定調整后的網絡模型參數和加權交叉熵損失函數。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人福建電子口岸股份有限公司,其通訊地址為:361000 福建省廈門市軟件園二期觀日路44號6樓;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。