成都信息工程大學;水電水利規劃設計總院;水電水利規劃設計總院有限公司;中國水利水電建設工程咨詢有限公司金鑫獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉成都信息工程大學;水電水利規劃設計總院;水電水利規劃設計總院有限公司;中國水利水電建設工程咨詢有限公司申請的專利基于Copula數據增強和XG-Boost算法的土石壩潰決洪峰預測方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120106312B 。
龍圖騰網通過國家知識產權局官網在2025-08-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510533670.8,技術領域涉及:G06Q10/04;該發明授權基于Copula數據增強和XG-Boost算法的土石壩潰決洪峰預測方法及系統是由金鑫;王志雨;賈超;王繼琳;任律;江婷設計研發完成,并于2025-04-27向國家知識產權局提交的專利申請。
本基于Copula數據增強和XG-Boost算法的土石壩潰決洪峰預測方法及系統在說明書摘要公布了:本發明屬于機器學習技術領域,具體公開了基于Copula數據增強和XG?Boost算法的土石壩潰決洪峰預測方法及系統;所述方法包括:S1、獲取歷史壩體數據并對歷史壩體數據進行數據預處理;S2、基于Student?T?Copula模型對壩體特征數據進行數據增強,并生成增強數據集Xaug;S3、引入基于模型訓練反饋的梯度擾動算法;S4、在生成增強數據Xaug和擾動增強樣本Xgrad后,進行逆變換操作并進行標簽預測,得到最終完整的增強數據集;S5、將增強數據集和壩體特征數據及其對應的標簽數據共同構成新的數據集,構建并訓練回歸模型;S6、輸入將當前壩體特征數據即得到預測的當前潰壩峰值流量。本發明通過數據增強和回歸模型的結合,有效解決現有方法中土石壩潰決洪峰預測精度不足、數據不足的問題。
本發明授權基于Copula數據增強和XG-Boost算法的土石壩潰決洪峰預測方法及系統在權利要求書中公布了:1.基于Copula數據增強和XG-Boost算法的土石壩潰決洪峰預測方法,其特征在于,包括以下步驟: S1、獲取歷史壩體數據并對歷史壩體數據進行數據預處理,進而得到壩體特征數據及其對應的標簽數據;具體步驟包括: 預設X={X1,X2,X3,…,Xn}代表壩體特征數據; 預設y={y1,y2,y3,…,yn}代表與壩體特征數據對應的標簽數據; 使用標準化公式對壩體特征數據進行處理,標準化公式為: ; 式中,表示標準化后的壩體特征數據,表示壩體特征數據的均值,為壩體特征數據的標準差,表示壩體特征數據; 將標準化后的壩體特征數據轉換為均勻分布,轉換的公式為: ; 式中,是變換后的壩體特征數據,是壩體特征數據x的累積分布函數CDF,是壩體特征數據的累積分布函數的逆函數; 其中,所述歷史壩體數據包括壩高、庫容、孔隙率和潰壩峰值流量,其中,將壩高、庫容和孔隙率作為壩體特征數據,將壩體特征數據對應的潰壩峰值流量作為標簽數據; S2、基于Student-T-Copula模型對壩體特征數據進行數據增強,并生成增強數據集: 所述基于Student-T-Copula模型對壩體特征數據進行數據增強,進而得到增強數據的步驟,具體包括: 使用Student-T-Copula模型捕捉壩體特征數據中變量之間的關系,其表達式為: ; 式中,是自由度為ν的學生t分布,是第i個邊緣分布的逆CDF,是Student-T-Copula模型的參數; 通過Student-T-Copula模型和隨機變量從均勻分布中采樣,進而生成新的壩體特征數據,即增強數據,其表達式為: ; 式中,是增強數據,u=u1,u2,…,ud是從均勻分布中采樣的隨機變量,是Student-T-Copula模型的逆變換操作; 具體的,自定義student-Tcopula采樣函數的代碼表示為: 【defstudent_t_copula_samplen,dim,nu=5: 自定義student-Tcopula采樣函數 -n:樣本數量 -dim:數據維度 -nu:自由度參數 #生成t分布樣本,使用標準t分布并進行累積分布函數(CDF轉換 u=t.cdfnp.random.standard_tnu,size=n,dim,df=nu returnu】; S3、為提高增強數據的多樣性及邊界樣本質量,在Student-T-Copula增強樣本基礎上,引入基于模型訓練反饋的梯度擾動算法,步驟如下: 首先,使用由原始訓練數據訓練得到的基礎回歸模型,該模型采用隨機森林對增強樣本進行偽標簽估計: ; 式中,是使用模型預測得到的偽標簽;是增強樣本集合中的第i個增強樣本; 設定當前訓練好的回歸模型f來有效擬合壩體特征數據與其標簽之間的非線性映射關系,該模型基于支持向量回歸SVR并結合粒子群優化PSO算法進行超參數調優; 根據與f得到的樣本預測結果,定義損失函數為樣本與其估計標簽的均方誤差: ; 式中,為損失函數,表示利用原始訓練數據訓練得到的基礎回歸模型對增強樣本的偽標簽估計;f為當前訓練中的回歸模型,擬合目標為上述偽標簽; 根據損失函數得到計算樣本在輸入空間的梯度方向: ; 式中,為損失函數對樣本xi的梯度向量;該梯度表示損失函數隨特征向量的敏感方向,用于引導樣本向更高誤差區域擾動,以提高模型對邊界樣本或易混樣本的學習能力;表示損失函數在樣本xi上的梯度; 再結合梯度向量生成擾動樣本,擾動方式如下: ; 式中,為第i個擾動增強樣本,η為擾動步長,為微小常數防止除零;為梯度的歐幾里得范數,用于歸一化方向; 將擾動后的樣本加入增強數據中,構成擾動增強樣本集: ; 式中,為擾動增強樣本集; S4、在生成增強數據Xaug和擾動增強樣本Xgrad后,進行逆變換操作并進行標簽預測;具體包括: 將增強數據進行逆轉換,使其符合原始特征空間;具體的逆變換公式為: ; 式中,是將增強數據通過CDF匹配回原始分布后的值,也就是逆變換后的結果;是增強后的特征數據Xaug中的一個樣本分量,來自通過Student-T-Copula模型生成的偽樣本;表示增強數據當前估計的CDF;是原始壩體特征數據的CDF的逆函數; 逆變換的目的是將增強樣本從標準化或均勻分布的空間映射回原始數據的特征空間,這樣生成的樣本才具有與原始數據一致的物理意義和分布; 使用訓練完成的回歸模型對增強數據進行標簽預測,表達式為: ; ; 式中,f為通過增強樣本與偽標簽訓練得到的回歸模型; 構建最終增強數據集,將原始增強樣本與梯度擾動增強樣本合并,構成最終增強數據集: ; ; 式中,為Student-T-Copula生成的原始增強樣本;為引入基于模型訓練反饋的梯度擾動算法后生成的梯度擾動增強樣本;為原始增強樣本與梯度擾動增強樣本的合集;為原始增強樣本和梯度擾動增強樣本兩部分增強樣本預測標簽的合集;最終得到增強數據集Xtotal,ytotal用于后續模型訓練與測試; 其中,回歸模型的訓練過程為:將壩體特征數據作為輸入特征數據,將壩體特征數據對應的標簽數據作為輸出數據,利用輸入特征數據和輸出數據對回歸模型進行訓練,即得到訓練完成的回歸模型; S5、將增強數據集和壩體特征數據及其對應的標簽數據共同構成新的數據集,利用新的數據集構建并訓練XG-Boost回歸模型,進而得到訓練完成的XG-Boost回歸模型;具體步驟包括:將最終增強數據集和壩體特征數據及其對應的標簽數據共同構成新的數據集,將新的數據集以8:2的比例劃分為訓練集和測試集; 定義一個XG-Boost回歸模型,設置一個基學習器,然后利用訓練集訓練XG-Boost回歸模型,用于捕捉數據中的非線性關系; 通過網格搜索法和交叉驗證對XG-Boost回歸模型進行超參數調優; 通過測試集對新的數據集中的輸出數據進行重新預測,通過RMSE、R2對XG-Boost回歸模型進行評估,直至XG-Boost回歸模型的RMSE與R2達到預設的閾值; S6、獲取當前壩體特征數據,對當前壩體特征數據進行預處理并輸入訓練完成的XG-Boost回歸模型,即得到預測的當前潰壩峰值流量。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人成都信息工程大學;水電水利規劃設計總院;水電水利規劃設計總院有限公司;中國水利水電建設工程咨詢有限公司,其通訊地址為:610225 四川省成都市西南航空港經濟開發區學府路1段24號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。