上海大學孫彥贊獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉上海大學申請的專利TDD網絡中聯合上下行切片資源分配的方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114501468B 。
龍圖騰網通過國家知識產權局官網在2025-09-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210161507.X,技術領域涉及:H04W16/10;該發明授權TDD網絡中聯合上下行切片資源分配的方法是由孫彥贊;黃炎禹;張舜卿;吳雅婷設計研發完成,并于2022-02-22向國家知識產權局提交的專利申請。
本TDD網絡中聯合上下行切片資源分配的方法在說明書摘要公布了:一種TDD網絡中聯合上下行切片資源分配的方法,通過構建無線接入網仿真環境,在單步內針對被服務的各個切片的用戶分別進行資源調度后,在當前Step中將上一個單步運行得到的狀態輸入到深度確定策略梯度算法實例化得到智能體的神經網絡中,通過神經網絡得到動作作用于當前Step的無線接入網仿真環境,環境運行后反饋更新狀態和所執行的動作對應的獎勵,并將狀態、動作、獎勵、State’作為一條經驗存入智能體的記憶池,當儲存的經驗數量到達設定的閾值時,抽取其中的經驗對智能體進行訓練,智能體訓練結束后,將訓練得到的智能體進行在線測試。本發明基于深度確定性策略梯度算法,避免了某個切片的意外溢出而導致SLA的下降。
本發明授權TDD網絡中聯合上下行切片資源分配的方法在權利要求書中公布了:1.一種TDD網絡中聯合上下行切片資源分配的方法,其特征在于,通過構建無線接入網仿真環境,在單步Step內針對被服務的各個切片的用戶分別進行資源調度后,在當前Step中將上一個單步運行得到的狀態輸入到深度確定策略梯度算法DDPG實例化得到智能體的神經網絡中,通過神經網絡得到動作作用于當前Step的無線接入網仿真環境,環境運行后反饋更新狀態State’和所執行的動作對應的獎勵,并將狀態State、動作Action、獎勵Reward、State’作為一條經驗存入智能體的記憶池,當儲存的經驗數量到達設定的閾值時,抽取其中的經驗對智能體進行訓練,智能體訓練結束后,將訓練得到的智能體進行在線測試,具體包括: 步驟1、構建無線接入網仿真環境,通過DDPG生成智能體,在初始狀態下無線接入網仿真環境根據隨機生成一個可取的動作進行相應環境配置,針對被服務的各個切片的用戶依據動作給出的資源劃分結構分別進行資源調度,并得到對應的狀態; 步驟2、將智能體與仿真環境進行交互,進行K個回合的訓練,每個Episode包含M個Step,通過與仿真環境交互訓練得到收斂的神經網絡; 步驟3、將訓練得到的智能體與仿真環境進行交互測試,具體為:測試階段收集統計該回合內各切片的上下行服務請求量、各切片上下行SLA滿足率、各切片上下行切片利用率,獎勵值,用于評估訓練得到的智能體的性能; 所述的回合是指連續執行M個單步,過程中無線接入網環境持續根據輸入的Action而發生變化,在下一個回合開始前,無線接入網環境會重新初始化到最初狀態; 所述的通過DDPG生成智能體,包括:Actor神經網絡和Critic神經網絡,其網絡結構均包括輸入層、兩個隱藏層和輸出層; 所述的Actor網絡的輸入層維度為,即State的維度為;智能體輸出的動作Action包含:時域資源劃分比例、下行切片分配比例、……和上行切片分配比例、……,因此動作的維度為,則Critic網絡輸入層的輸入維度等于; 所述的是一個0~1的值,決定了無線時頻資源中一個子幀所包含的OFDM符號的上下行分配比例,所有OFDM符號的前部分用作下行傳輸,所有OFDM符號的后部分用作上行傳輸; 所述的參數、……分別表示下行鏈路每個切片在頻域上分配得到的帶寬比例,參數求和為1; 所述的參數、……分別表示上行鏈路每個切片在頻域上分配得到的帶寬比例,參數求和為1; 所述的構建無線接入網仿真環境進一步包括:設置無線接入網的參數包括服務半徑、基站發送功率、空口路損函數、用戶終端發送功率、空口帶寬、配置各個切片內的調度算法; 所述的動作給出的資源劃分結構是指:對無線空口時頻資源的劃分方法,根據動作Action,在時域上對多個切片的上下行幀結構上保持對齊,再在頻域上將帶寬資源分配給不同切片; 所述的各個切片內的調度算法是指:不同切片在切片內對用戶進行資源調度時,選擇現有的調度算法,可選調度算法包括輪詢調度算法RR和最早截止時間優先調度算法EDF; 所述的交互是指:在該Step中,將上一個單步運行得到的狀態輸入到智能體的神經網絡中,通過神經網絡得到新的動作作用于無線接入網仿真環境的當前Step,環境反饋更新狀態State’和所執行的動作對應的獎勵,并將State、Action、Reward、State’作為一條經驗存入智能體的記憶池,當儲存的經驗數量到達設定的閾值時,抽取其中的經驗對智能體進行訓練; 所述的獎勵是指:環境對智能體給出的Action的打分,以引導智能體作出更好的決策;計算方式是:當該回合調度完畢后,統計該回合內各切片的上下行服務請求量、各切片上下行SLA滿足率、各切片上下行切片利用率作為狀態,計算得到對應的獎勵值,其中:切片在方向上的QoS權重,切片在方向上的QoS值,切片在方向上的資源利用率,var為方差函數,方差項的權重,通過將QoS作為Reward的正向部分,引導智能體去保證切片的服務質量,通過將切片的負載平衡情況,即方差項,作為Reward的扣分項,來引導智能體保證切片之間的負載均衡。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人上海大學,其通訊地址為:200444 上海市寶山區上大路99號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。