南京航空航天大學盧曉珍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南京航空航天大學申請的專利一種基于風險規避的聯邦安全強化學習方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115879503B 。
龍圖騰網通過國家知識產權局官網在2025-09-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211624385.X,技術領域涉及:G06N3/045;該發明授權一種基于風險規避的聯邦安全強化學習方法是由盧曉珍;陳煜涵;卜艷玲;胡峰設計研發完成,并于2022-12-16向國家知識產權局提交的專利申請。
本一種基于風險規避的聯邦安全強化學習方法在說明書摘要公布了:本發明公開了一種基于風險規避的聯邦安全強化學習方法,提高聯邦訓練效率的同時規避模型聚合失敗等危險狀態。該方法首先構建策略風險評估機制,采用隱私保護水平和模型訓練精度作為評判標準,設計基于長期風險值的R網絡和基于長期折扣期望效益的Q網絡,服務器采用深度強化學習算法選擇參與節點,綜合提高聯邦學習模型訓練精度和速度,并進一步保護用戶的數據隱私。
本發明授權一種基于風險規避的聯邦安全強化學習方法在權利要求書中公布了:1.一種基于風險規避的聯邦安全強化學習方法,其特征在于,包括以下步驟: 1獲取移動邊緣計算系統,假設所述移動邊緣計算系統中包含M個邊緣設備以及N個節點; 2對M個所述邊緣設備中的第i個邊緣設備構建雙深度網絡模型,所述雙深度網絡模型包括一個R網絡和一個Q網絡,初始化所述R網絡和所述Q網絡的權重參數和初始化學習率α、折扣因子δ; 3所述邊緣設備i觀測k時刻通信范圍內的可選參與節點個數 4所述邊緣設備i構建k時刻所述移動邊緣計算系統的狀態向量具體過程為:在時刻k,所述邊緣設備i獲取通信范圍內的參與節點個數獲取所述邊緣設備i與各參與節點間信道的帶寬通過信道估計方法估計所述邊緣設備i與參與節點j的信道增益其中1≤i≤M,根據信息,所述邊緣設備i估計上一時刻的雙深度網絡模型的訓練精度并且衡量上一時刻參與節點j的隱私保護水平并測量訓練全局模型的時延以及訓練全局模型的能耗則有,所述邊緣設備i構建的狀態向量如下: 5通過步驟3中所述邊緣設備i選擇的參與節點將本地模型參數發送給所述邊緣設備,所述本地模型為雙深度網絡模型; 6所述邊緣設備i將所有的參與節點發送的本地模型參數進行聚合得到全局模型參數,然后將所述全局模型參數分發給所述參與節點進行參數更新; 7所述邊緣設備i計算效益; 8所述邊緣設備i評估風險值; 9所述邊緣設備i將包含所述狀態向量、所述節點的選擇策略、所述效益、所述評估風險值的經驗存入經驗池; 10所述邊緣設備i隨機從所述經驗池中采樣出Z條經驗,根據采樣出的Z條經驗構建批處理樣本; 11更新所述雙深度網絡的權重參數和 12重復步驟3~11,直到M個邊緣設備學習到穩定的參與節點選擇策略。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京航空航天大學,其通訊地址為:210016 江蘇省南京市秦淮區御道街29號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。