北京郵電大學李雅文獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京郵電大學申請的專利基于強化學習的自適應約束聯邦學習方法、裝置及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119129692B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202410967977.4,技術領域涉及:G06N3/092;該發明授權基于強化學習的自適應約束聯邦學習方法、裝置及系統是由李雅文;陳鈞天;寇菲菲;李昂設計研發完成,并于2024-07-18向國家知識產權局提交的專利申請。
本基于強化學習的自適應約束聯邦學習方法、裝置及系統在說明書摘要公布了:本申請提供基于強化學習的自適應約束聯邦學習方法、裝置及系統,方法包括:基于本地的強化學習代理單元,根據前一輪次的全局模型權重和本地模型權重確定作為當前輪次的動作的超參數;在訓練過程中基于超參數對本地模型進行自適應約束,將本輪的本地模型權重發送至聯邦學習系統中的服務器進行聚合,基于強化學習代理單元,根據前一輪次和當前輪次各自對應的全局模型權重和本地模型權重確定當前輪次的獎勵;構成當前輪次的元組樣本并存儲。本申請能夠減輕數據異質性的影響,能夠提高模型訓練的可靠性、有效性以及訓練得到的模型性能;通過本地的強化學習代理進行獨立決策,無需在服務器和客戶端之間進行額外的數據通信。
本發明授權基于強化學習的自適應約束聯邦學習方法、裝置及系統在權利要求書中公布了:1.一種基于強化學習的自適應約束聯邦學習方法,其特征在于,包括: 在預存儲至本地經驗池的前一輪次的元組樣本中,提取前一輪次的全局模型權重和本地模型權重,并基于本地的強化學習代理單元,根據前一輪次的全局模型權重和本地模型權重確定作為當前輪次的動作的超參數; 采用本地訓練集中的各個數據樣本訓練所述前一輪次的全局模型權重對應的本地模型,并在訓練過程中基于所述超參數對所述本地模型進行自適應約束,以得到所述本地模型在當前輪次的本地模型權重,將該本地模型權重發送至聯邦學習系統中的服務器,以使該服務器對當前輪次接收到的各個所述本地模型權重進行聚合以得到當前輪次的全局模型權重; 接收所述服務器發送的當前輪次的全局模型權重,基于本地的所述強化學習代理單元,根據前一輪次和當前輪次各自對應的全局模型權重和本地模型權重確定當前輪次的獎勵; 根據前一輪次的全局模型權重和本地模型權重、當前輪次的所述動作、當前輪次的所述獎勵以及當前輪次的全局模型權重和本地模型權重,構成當前輪次的元組樣本并存儲至所述本地經驗池中; 若所述本地經驗池中的所述元組樣本的數量已到達預設的數量閾值,則在所述本地經驗池中的除所述前一輪次的元組樣本之外的其他元組樣本中提取多個,并基于提取的各個所述元組樣本訓練所述強化學習代理單元; 接收聯邦學習系統中的服務器發送的相似客戶端設備的索引,其中,所述服務器根據當前輪次接收到各個所述本地模型權重之間的相似度,為分別發送所述本地模型權重的各個客戶端設備分別查找對應的相似客戶端設備,并將各個所述客戶端設備各自對應的相似客戶端設備的唯一標識分別發送至各個所述客戶端設備; 基于所述相似客戶端設備的索引,自該相似客戶端設備的經驗池復制多個所述元組樣本; 在基于自所述本地經驗池提取的各個所述元組樣本訓練本地的所述強化學習代理單元之后,基于自所述相似客戶端設備的經驗池復制的各個所述元組樣本訓練本地的所述強化學習代理單元。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京郵電大學,其通訊地址為:100876 北京市海淀區西土城路10號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。