上海壁仞科技股份有限公司請求不公布姓名獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉上海壁仞科技股份有限公司申請的專利一種顯存優(yōu)化方法、裝置、計算機設(shè)備、存儲介質(zhì)及計算機程序產(chǎn)品獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN120409707B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-23發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510896504.4,技術(shù)領(lǐng)域涉及:G06N5/04;該發(fā)明授權(quán)一種顯存優(yōu)化方法、裝置、計算機設(shè)備、存儲介質(zhì)及計算機程序產(chǎn)品是由請求不公布姓名設(shè)計研發(fā)完成,并于2025-06-30向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種顯存優(yōu)化方法、裝置、計算機設(shè)備、存儲介質(zhì)及計算機程序產(chǎn)品在說明書摘要公布了:本申請公開一種顯存優(yōu)化方法、裝置、計算機設(shè)備、存儲介質(zhì)及計算機程序產(chǎn)品,屬于人工智能技術(shù)領(lǐng)域,該方法中,在多個芯片上分布式訓(xùn)練深度學(xué)習(xí)模型的過程中,當(dāng)滿足預(yù)設(shè)條件時,獲取每個芯片的顯存負(fù)載信息,以及每個芯片上多個對象的顯存使用信息,多個對象對應(yīng)這個芯片執(zhí)行的不同訓(xùn)練任務(wù),根據(jù)每個芯片的顯存負(fù)載信息,以及這個芯片上多個對象的顯存使用信息,更新這個芯片的對象集合,根據(jù)每個芯片的對象集合,向這個芯片發(fā)送顯存優(yōu)化指示,以觸發(fā)這個芯片對這個對象集合中的對象應(yīng)用顯存優(yōu)化技術(shù)。這樣,每個芯片上應(yīng)用顯存優(yōu)化技術(shù)的對象可隨訓(xùn)練過程的變化而變化,顯存優(yōu)化與訓(xùn)練過程更匹配,顯存優(yōu)化更合理,因此,可提升模型訓(xùn)練效果。
本發(fā)明授權(quán)一種顯存優(yōu)化方法、裝置、計算機設(shè)備、存儲介質(zhì)及計算機程序產(chǎn)品在權(quán)利要求書中公布了:1.一種顯存優(yōu)化方法,其特征在于,包括: 在多個芯片上分布式訓(xùn)練深度學(xué)習(xí)模型的過程中,每當(dāng)滿足預(yù)設(shè)條件時,獲取每個芯片的顯存負(fù)載信息,所述芯片上多個對象的顯存使用信息,以及最近L輪迭代過程中所述芯片上每個對象對應(yīng)的訓(xùn)練耗時,所述多個對象對應(yīng)所述芯片執(zhí)行的多種訓(xùn)練任務(wù),所述深度學(xué)習(xí)模型是混合專家模型,所述混合專家模型包括多個專家網(wǎng)絡(luò),每個專家網(wǎng)絡(luò)放在一個芯片上,L是大于零的整數(shù); 根據(jù)每個芯片的顯存負(fù)載信息,以及所述芯片上多個對象的顯存使用信息,確定對所述芯片的顯存優(yōu)化力度的調(diào)節(jié)方式; 根據(jù)對所述芯片的顯存優(yōu)化力度的調(diào)節(jié)方式,更新所述芯片的對象集合,所述對象集合用于保存所述芯片上應(yīng)用顯存優(yōu)化技術(shù)的對象,其中,每個對象對應(yīng)有顯存優(yōu)化類型,所述顯存優(yōu)化類型是激活值重計算或張量卸載,每個對象對應(yīng)的顯存優(yōu)化技術(shù)在各顯存優(yōu)化技術(shù)中對所述對象的訓(xùn)練任務(wù)的影響最小,所述調(diào)節(jié)方式是減小顯存優(yōu)化力度時,從所述對象集合中剔除訓(xùn)練耗時最長、且顯存使用量小于所述芯片的顯存剩余量的對象,所述調(diào)節(jié)方式是增大顯存優(yōu)化力度時,向所述對象集合中添加未在所述對象集合中且訓(xùn)練耗時最短的對象; 根據(jù)每個芯片的對象集合,向所述芯片發(fā)送顯存優(yōu)化指示,所述顯存優(yōu)化指示用于觸發(fā)所述芯片對所述對象集合中的對象應(yīng)用顯存優(yōu)化技術(shù),其中,所述芯片對所述芯片的對象集合中的每個對象,應(yīng)用所述對象的顯存優(yōu)化類型對應(yīng)的顯存優(yōu)化技術(shù)。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人上海壁仞科技股份有限公司,其通訊地址為:201114 上海市閔行區(qū)陳行公路2388號16幢13層1302室;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。