浙江工業大學姚信威獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉浙江工業大學申請的專利一種基于深度強化學習的群智感知激勵機制方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114021695B 。
龍圖騰網通過國家知識產權局官網在2025-09-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111107795.2,技術領域涉及:G06N3/092;該發明授權一種基于深度強化學習的群智感知激勵機制方法是由姚信威;楊嘯天;王佐響;張馨戈;齊楚鋒;邢偉偉設計研發完成,并于2021-09-22向國家知識產權局提交的專利申請。
本一種基于深度強化學習的群智感知激勵機制方法在說明書摘要公布了:本發明涉及一種基于深度強化學習的群智感知激勵機制方法,獲取參與者位置和移動軌跡信息,將參與者移動過程建模為馬爾可夫決策過程,采用深度強化學習預測其在下一個激勵周期內的移動軌跡,預測參與者在下一個激勵周期結束時的位置分布,通過計算參與者的預測位置分布與數據請求方提供的感知數據目標分布的相對熵,選擇大于相對熵閾值區域內的參與者進行激勵。本發明避免在同一時間段內對所有參與者進行激勵、對同一個參與者在所有激勵周期內都進行激勵,合理的激勵機制解決群智感知參與者收集到的感知數據分布情況與數據請求方提供的目標數據分布之間差異較大、覆蓋質量較低的問題;可被廣泛應用于移動群智感知領域,降低激勵參與者的成本。
本發明授權一種基于深度強化學習的群智感知激勵機制方法在權利要求書中公布了:1.一種基于深度強化學習的群智感知激勵機制方法,其特征在于:所述方法包括以下步驟: 步驟1:設置激勵周期T; 步驟2:獲取每個激勵周期T的初始狀態下參與者的移動軌跡,包括以下步驟: 步驟2.1:根據感知區域的大小將感知區域劃分成a×b的網格系統; 步驟2.2:將激勵周期T劃分成長度為t的時間間隔; 步驟2.3:每隔時間t,通過群智感知參與者攜帶的智能設備GPS傳感器獲取參與者的位置,獲取每個參與者當前所處位置的經緯度信息,并轉換至a×b的網格系統的坐標系中,以坐標i,j表示,1≤i≤a,1≤j≤b; 步驟2.5:根據坐標信息,得到每個參與者在激勵周期T內的移動軌跡; 步驟3:基于深度強化學習,以初始狀態下參與者的移動軌跡預測參與者當前激勵周期內的移動軌跡,獲得當前激勵周期結束時參與者的預測位置; 步驟4:根據當前激勵周期結束時參與者的預測位置,獲得數據請求方提供的感知數據目標分布,選擇合適參與者進行激勵; 步驟5:計算當前激勵周期結束時參與者實際位置分布與感知數據目標分布的相對熵與當前激勵周期內需要的激勵成本,基于計算結果調整激勵周期T,包括以下步驟: 步驟5.1:統計當前激勵周期內激勵的參與者人數; 步驟5.2:根據激勵的參與者人數計算需要支付的激勵成本; 步驟5.3:計算當前激勵周期結束時參與者實際位置分布與感知數據目標分布的相對熵; 步驟5.4:根據激勵成本和相對熵調整激勵周期T。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江工業大學,其通訊地址為:310014 浙江省杭州市潮王路18號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。