重慶郵電大學雷建軍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉重慶郵電大學申請的專利一種基于深度強化學習的物聯網路由優化方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116033513B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310055487.2,技術領域涉及:H04W40/02;該發明授權一種基于深度強化學習的物聯網路由優化方法是由雷建軍;劉捷;譚德望;周盈設計研發完成,并于2023-01-17向國家知識產權局提交的專利申請。
本一種基于深度強化學習的物聯網路由優化方法在說明書摘要公布了:本發明屬于無線網絡通信技術領域,具體涉及一種基于深度強化學習的物聯網路由優化方法;該方法包括:將匯聚節點和普通傳感器節點組網,構建DODAG;進入數據傳輸階段,傳感器節點進行數據包收發操作;數據傳輸階段結束后,喚醒Trickle定時器重置DIO間隔;進入路由優化階段,所有節點根據DIO間隔廣播DIO控制消息;傳感器節點從匯聚節點下載最新模型參數;根據最新模型參數和鄰居傳感器節點的DIO控制消息進行路由選擇并生成經驗信息;匯聚節點根據經驗對DuelingDQN模型進行訓練,更新模型參數;路由優化階段結束后,凍結Trickle定時器;本發明可以提升網絡的負載平衡,生命周期以及可靠性等各項性能。
本發明授權一種基于深度強化學習的物聯網路由優化方法在權利要求書中公布了:1.一種基于深度強化學習的物聯網路由優化方法,其特征在于,包括: S1:將匯聚節點作為根節點,普通傳感器節點作為子孫節點以樹形結構進行組網,構建DODAG; S2:進入數據傳輸階段,傳感器節點進行數據包收發操作;數據傳輸階段結束后,喚醒Trickle定時器重置DIO間隔; S3:進入路由優化階段,所有節點根據DIO間隔廣播DIO控制消息; S4:傳感器節點從匯聚節點下載最新模型參數;根據最新模型參數和鄰居傳感器節點的DIO控制消息進行路由選擇并生成經驗信息;將經驗信息上傳至匯聚節點;進行路由選擇并生成經驗信息的過程包括: S41:根據鄰居傳感器節點的DIO控制消息獲取路由度量信息并根據路由度量信息構建狀態矩陣;構建狀態矩陣的過程包括:根據DIO控制消息獲取鄰居傳感器節點的路由度量,包括ETX、HC、RE和QLR;根據路由度量在候選父節點中找出最高RE值的k個節點生成狀態矩陣,若候選父節點數小于k,則將全部候選節點填入狀態矩陣,余下條目用0填充;其中,矩陣大小為4行k列; S42:根據最新模型參數和狀態矩陣計算動作a,根據動作a進行路由選擇并切換父節點;所述動作a由本地路由模塊輸入狀態矩陣計算得出,表示數據傳輸階段選擇a值在狀態矩陣中對應的節點作為父節點進行數據轉發;其中a∈ [0,k-1],k表示狀態矩陣列數; S43:根據動作a和父節點的路由度量信息計算獎勵值;計算獎勵值的公式為: 其中,r表示獎勵值,RankNi表示節點i的rank值;m表示節點的候選父節點個數; rank值的計算公式為: RankNi=Rankp+ω1QUp+ω2ECRp 其中,Rankp表示節點i的父節點p的rank值,QUp表示父節點p的隊列利用率,ECRp表示父節點能量消耗率,ω1表示第一權重,ω2表示第二權重; S44:根據狀態矩陣、動作a和獎勵值生成經驗信息; S5:匯聚節點根據經驗對DuelingDQN模型進行訓練,更新模型參數; S6:路由優化階段結束后,凍結Trickle定時器; S7:返回步驟S2,進行下一次路由選擇周期,直到網絡停止運行。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人重慶郵電大學,其通訊地址為:400065 重慶市南岸區南山街道崇文路2號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。