之江實驗室王原原獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉之江實驗室申請的專利一種面向集群的大模型并行方法、裝置和電子裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120353601B 。
龍圖騰網通過國家知識產權局官網在2025-09-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510788730.0,技術領域涉及:G06F9/50;該發明授權一種面向集群的大模型并行方法、裝置和電子裝置是由王原原;俞鼎鼎;唐娜娜;王雨旸;楊非設計研發完成,并于2025-06-13向國家知識產權局提交的專利申請。
本一種面向集群的大模型并行方法、裝置和電子裝置在說明書摘要公布了:本申請涉及一種面向集群的大模型并行方法、裝置和電子裝置,應用于大模型領域,其中,該方法包括:獲取面向集群的大模型在預設微處理批次及預設并行方式下的算子信息,算子信息包括面向集群的大模型中算子的算子時間信息和算子內存信息;集群包括一種或多種類型的加速器;基于算子信息、大模型所需的模型內存信息以及加速器的內存最值,確定大模型中多個流水線的初始算子并行配置策略;根據預設的負載均衡方式,對初始算子并行配置策略進行遞歸處理,得到目標算子并行配置策略,基于目標算子并行配置策略,運行面向集群的大模型。通過本申請提高了大模型并行配置時芯片計算性能的利用效率,實現了大模型訓練的高效性且適用廣泛性。
本發明授權一種面向集群的大模型并行方法、裝置和電子裝置在權利要求書中公布了:1.一種面向集群的大模型并行方法,其特征在于,所述方法包括: 獲取面向集群的大模型在預設微處理批次及預設并行方式下的算子信息,所述算子信息包括面向集群的大模型中算子的算子時間信息和算子內存信息;所述集群包括一種或多種類型的加速器; 根據所述加速器的內存最值以及所述算子信息中的算子內存信息,確定預設微處理批次及預設并行方式下的流水線對應的第一集群內存比值;根據所述加速器的內存最值、所述算子信息中的算子內存信息以及計算算子內存信息中的算子激活值,確定預設微處理批次及預設并行方式下的流水線對應的第二集群內存比值;所述第一集群內存比值不大于所述第二集群內存比值;基于所述第一集群內存比值和所述第二集群內存比值,確定所述大模型中多個流水線的初始算子并行配置策略; 根據預設的負載均衡方式,對所述初始算子并行配置策略進行遞歸處理,得到目標算子并行配置策略,基于所述目標算子并行配置策略,運行所述面向集群的大模型; 所述初始算子并行配置策略中包括第一流水線和第二流水線;所述第一流水線和第二流水線為相鄰流水線;所述根據預設的負載均衡方式,對所述初始算子并行配置策略進行遞歸處理,得到目標算子并行配置策略,包括:獲取所述第一流水線的第一訓練時間以及所述第二流水線的第二訓練時間;判斷所述第一訓練時間和所述第二訓練時間的時間差值是否小于預設的時間閾值;若所述時間差值不小于所述預設的時間閾值,遞歸移動所述第一流水線的算子至所述第二流水線,直至所述第一訓練時間和所述第二訓練時間的時間差值小于預設的時間閾值,得到中間算子并行配置策略; 在所述第一訓練時間和所述第二訓練時間的時間差值小于預設的時間閾值的情況下,判斷所述中間算子并行配置策略的第一流水線的并行內存是否超過預設的內存閾值;若所述第一流水線的并行內存超過預設的內存閾值,則更新所述微處理批次;判斷更新微處理批次后的第一流水線的并行內存是否超過預設的內存閾值;若所述更新微處理批次后的第一流水線的并行內存未超過預設的內存閾值,則依次處理所述第二流水線的并行內存。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人之江實驗室,其通訊地址為:311121 浙江省杭州市余杭區中泰街道科創大道之江實驗室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。