中國科學院大氣物理研究所楊婷獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉中國科學院大氣物理研究所申請的專利一種多模態強化學習驅動的PM2.5化學組分垂直廓線反演系統及方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120123697B 。
龍圖騰網通過國家知識產權局官網在2025-08-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510589239.5,技術領域涉及:G06F18/20;該發明授權一種多模態強化學習驅動的PM2.5化學組分垂直廓線反演系統及方法是由楊婷;王自發;張詩語;李弘毅;宋逸凡;田雨彤;譚怡寧設計研發完成,并于2025-05-08向國家知識產權局提交的專利申請。
本一種多模態強化學習驅動的PM2.5化學組分垂直廓線反演系統及方法在說明書摘要公布了:本發明公開了一種多模態強化學習驅動的PM2.5化學組分垂直廓線反演系統及方法,其中:系統包括深度強化學習模型;深度強化學習模型包括狀態空間、Action動作空間、獎勵函數、Actor網絡和Critic網絡;深度強化學習模型用于根據Action動作空間輸出的PM2.5各化學組分濃度的垂直廓線預測值與實際監測值間的差異,結合獎勵函數,計算當前時刻的獎勵值;根據策略評估的評估結果,利用梯度下降方法持續進行策略迭代,直至待深度強化學習模型收斂后,得到最優的目標深度強化學習模型。采用Actor?Critic網絡動態優化策略,結合邊緣計算實現分鐘級模型更新,解決了傳統模型高空盲區、實時性不足等問題。
本發明授權一種多模態強化學習驅動的PM2.5化學組分垂直廓線反演系統及方法在權利要求書中公布了:1.一種多模態強化學習驅動的PM2.5化學組分垂直廓線反演系統,其特征在于,包括多模態數據輸入層、數據融合與預處理模塊、深度強化學習模型: 所述多模態數據輸入層用于獲取多模態終端采集的多模態源數據,并對多模態源數據執行預處理以及歸一化處理;然后執行Actor-Critic網絡參數的初始化網絡參數處理操作; 所述數據融合與預處理模塊用于執行時空對齊處理以及去噪處理;在時空對齊處理時,首先執行空間對齊,采用克里金插值將衛星遙感數據匹配至激光雷達垂直網格,然后利用動態時間規整算法衡量長度不同的時間序列的相似度,對齊地面監測站的時間序列;在執行去噪處理時,對激光雷達光學參數應用小波閾值去噪得到去噪后的數據; 所述深度強化學習模型用于根據Action動作空間輸出的PM2.5各化學組分濃度的垂直廓線預測值與實際監測值間的差異,結合獎勵函數,計算當前時刻的獎勵值;然后對當前策略進行策略評估得到評估結果;然后根據策略評估的評估結果,基于策略梯度方法計算Actor網絡的梯度包括:將得到的歸一化后的多模態數據的當前狀態張量;將多模態輸入數據進行轉化輸出歸一化的動作張量;Actor網絡執行前向傳播,利用多層Transformer編碼器,通過自注意力機制捕捉并整合跨高度層的長程依賴,輸出對應PM2.5各化學組分濃度垂直廓線的預測值;并通過Critic網絡執行前向傳播:輸入相同的狀態張量給基于GCN的Critic網絡,得到當前狀態對應的狀態價值;在執行獎勵評估時,根據輸出的PM2.5各化學組分濃度的垂直廓線預測值與實際監測值之間的差異,結合獎勵函數,計算當前時刻的獎勵值;利用Critic網絡輸出的狀態價值和實際采集到的獎勵,計算兩者之間誤差得到優勢函數;在更新所述Actor網絡時,使用所述優勢函數來計算當前Actor網絡的梯度;利用梯度下降方法持續進行策略迭代,直至待所述深度強化學習模型收斂后,得到對應的Actor-Critic網絡參數以及輸出得到最優的目標深度強化學習模型; 所述獎勵函數為: ; 其中,α、β為權重系數,Temporal_Inconsistency為懲罰相鄰時間步預測結果的突變,為垂直廓線預測值與實際監測值之間的均方根誤差。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中國科學院大氣物理研究所,其通訊地址為:100020 北京市朝陽區北辰西路81號院;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。