山東大學(xué)李峰獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉山東大學(xué)申請的專利通算一體的多模態(tài)聯(lián)邦學(xué)習(xí)任務(wù)資源調(diào)度方法及介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN120416051B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-23發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510896395.6,技術(shù)領(lǐng)域涉及:H04L41/0896;該發(fā)明授權(quán)通算一體的多模態(tài)聯(lián)邦學(xué)習(xí)任務(wù)資源調(diào)度方法及介質(zhì)是由李峰;陳旭;胡鵬飛;吳思設(shè)計(jì)研發(fā)完成,并于2025-07-01向國家知識產(chǎn)權(quán)局提交的專利申請。
本通算一體的多模態(tài)聯(lián)邦學(xué)習(xí)任務(wù)資源調(diào)度方法及介質(zhì)在說明書摘要公布了:本申請屬于聯(lián)邦學(xué)習(xí)領(lǐng)域,具體涉及一種通算一體的多模態(tài)聯(lián)邦學(xué)習(xí)任務(wù)資源調(diào)度方法及介質(zhì),包括如下步驟:搭建多任務(wù)多模態(tài)聯(lián)邦學(xué)習(xí)環(huán)境,完成初始信息探索,使用預(yù)設(shè)提示詞技術(shù)調(diào)用大模型生成獎(jiǎng)勵(lì)建模函數(shù),由兩層強(qiáng)化學(xué)習(xí)智能體進(jìn)行每個(gè)客戶端參與任務(wù)與分配帶寬資源的決策。由客戶端完成本地訓(xùn)練并收集訓(xùn)練過程參數(shù),獎(jiǎng)勵(lì)建模函數(shù)根據(jù)訓(xùn)練過程參數(shù)計(jì)算獎(jiǎng)勵(lì),并指導(dǎo)更新兩層強(qiáng)化學(xué)習(xí)智能體,直至完成收斂既定目標(biāo)或到達(dá)最大通信輪次。本發(fā)明所公開的方法能夠支持?jǐn)?shù)據(jù)分布不均、數(shù)據(jù)模態(tài)缺失、帶寬資源有限等多種復(fù)雜場景,最小化多任務(wù)多模態(tài)聯(lián)邦學(xué)習(xí)收斂時(shí)延。
本發(fā)明授權(quán)通算一體的多模態(tài)聯(lián)邦學(xué)習(xí)任務(wù)資源調(diào)度方法及介質(zhì)在權(quán)利要求書中公布了:1.一種通算一體的多模態(tài)聯(lián)邦學(xué)習(xí)任務(wù)資源調(diào)度方法,其特征在于,包括如下步驟: S1.搭建多任務(wù)多模態(tài)聯(lián)邦學(xué)習(xí)環(huán)境,設(shè)置各任務(wù)收斂的目標(biāo)正確率;服務(wù)器調(diào)用大語言模型生成獎(jiǎng)勵(lì)預(yù)測函數(shù),各客戶端完成一個(gè)輪次的本地訓(xùn)練,得到各個(gè)任務(wù)的損失值與訓(xùn)練時(shí)間,并將結(jié)果反饋給服務(wù)器; S2.服務(wù)器將每個(gè)客戶端對應(yīng)的狀態(tài)提交給高層智能體;由高層智能體決策客戶端在當(dāng)前輪次是否參與任務(wù)或參與何種任務(wù); 通過強(qiáng)化學(xué)習(xí)的動(dòng)作決策過程,決策得到所有客戶端的動(dòng)作集合;客戶端的狀態(tài)集合包括,其中代表輪次結(jié)束之后客戶端在全部任務(wù)上的損失值的記錄;代表輪次結(jié)束后客戶端在全部任務(wù)上的訓(xùn)練時(shí)間預(yù)測;代表各個(gè)任務(wù)的收斂目標(biāo)與輪次結(jié)束時(shí)測試正確率的差;代表客戶端在第輪完成時(shí)的剩余參與時(shí)間;代表客戶端在前輪各個(gè)任務(wù)累計(jì)參與的次數(shù),在時(shí)均為0;狀態(tài)集合在每輪次步驟S4完成更新,強(qiáng)化學(xué)習(xí)智能體決策出客戶端的動(dòng)作集合為,代表客戶端在第個(gè)輪次執(zhí)行的任務(wù)編號:其中當(dāng)時(shí)代表不參與本次訓(xùn)練,代表本輪次執(zhí)行任務(wù);代表客戶端在第個(gè)輪次的帶寬分配比例;為了加速強(qiáng)化學(xué)習(xí)智能體的收斂,采用分層強(qiáng)化學(xué)習(xí): 假設(shè)智能體對每個(gè)客戶端的決策相互獨(dú)立,因此每次智能體只讀入一個(gè)客戶端的狀態(tài)信息,決策動(dòng)作,并得到一個(gè)獎(jiǎng)勵(lì),同時(shí)強(qiáng)化學(xué)習(xí)智能體解耦合為高層智能體與低層智能體,其中,高層智能體讀入狀態(tài),決策動(dòng)作,當(dāng)客戶端被服務(wù)器選擇參與輪次的任務(wù)時(shí),低層智能體才會(huì)參與決策帶寬分配比例;低層智能體讀入狀態(tài),決策動(dòng)作; 由于兩層智能體互相獨(dú)立,設(shè)置高層智能體的演員網(wǎng)絡(luò)的輸出為離散動(dòng)作且,并通過對進(jìn)行采樣得到動(dòng)作;低層智能體的演員網(wǎng)絡(luò)采用高斯策略,其輸出為兩個(gè)實(shí)值參數(shù):和,分別表示客戶端在第輪的帶寬分配策略的期望值不確定性;由此構(gòu)造正態(tài)分布,并從中進(jìn)行采樣以獲得連續(xù)動(dòng)作,表示客戶端在本輪的帶寬占比,在所有低層智能體決策完帶寬占比后,服務(wù)器會(huì)收集所有客戶端的帶寬占比并歸一化; S3.服務(wù)器在決策參與任務(wù)的客戶端中隨機(jī)選擇一部分實(shí)際參與本輪次訓(xùn)練;低層智能體輸入每個(gè)被選擇參與任務(wù)的客戶端的狀態(tài),輸出決策的分配通信帶寬占比; S4.服務(wù)器向參與任務(wù)的客戶端下發(fā)對應(yīng)的全局模型參數(shù),客戶端開始本輪本地訓(xùn)練,訓(xùn)練完畢后將訓(xùn)練時(shí)間、本地訓(xùn)練損失值和模型參數(shù)的更新上傳給服務(wù)器,客戶端傳遞后等待下一個(gè)輪次的任務(wù)信息,服務(wù)器在接收到客戶端傳遞來的訓(xùn)練結(jié)果后,更新各個(gè)客戶端的狀態(tài)與各任務(wù)對應(yīng)的全局模型; S5.服務(wù)器將訓(xùn)練結(jié)果反饋給獎(jiǎng)勵(lì)預(yù)測函數(shù),由獎(jiǎng)勵(lì)預(yù)測函數(shù)生成兩個(gè)智能體對應(yīng)的子獎(jiǎng)勵(lì),并輸入給獎(jiǎng)勵(lì)生成模型,得到兩個(gè)智能體對應(yīng)的最終的獎(jiǎng)勵(lì),兩組智能體根據(jù)獎(jiǎng)勵(lì)值分別完成更新; S6.重復(fù)步驟S2至S6,直至到達(dá)各任務(wù)的收斂目標(biāo)或到達(dá)最大通信輪次。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人山東大學(xué),其通訊地址為:266200 山東省青島市即墨區(qū)濱海路72號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。