超星未來極摯(上海)科技有限公司張年崧獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉超星未來極摯(上海)科技有限公司申請的專利一種多任務神經網絡模型的剪枝方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114492783B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202011153067.0,技術領域涉及:G06N3/082;該發明授權一種多任務神經網絡模型的剪枝方法及裝置是由張年崧;陸天翼;唐長成;張劍設計研發完成,并于2020-10-26向國家知識產權局提交的專利申請。
本一種多任務神經網絡模型的剪枝方法及裝置在說明書摘要公布了:本發明實施例公開一種多任務神經網絡模型的剪枝方法及裝置,該方法包括:獲得待剪枝模型;針對待剪枝模型的每一卷積層,執行步驟A?C,確定每一卷積層的敏感度信息;A針對各預設層剪枝率,基于該預設層剪枝率及該卷積層中各卷積核,對該卷積層進行預剪枝;B基于第一訓練數據,確定該預設層剪枝率對應的預剪枝后的待剪枝模型所對應各任務損失值;C基于各任務損失值,確定該卷積層在該預設層剪枝率下的敏感度信息;基于待剪枝模型對應的通道信息,對待剪枝模型的卷積核進行分組;基于當前的模型剪枝率、卷積核的分組情況、各卷積核對應的剪枝范數值及每一卷積層的敏感度信息,確定目標剪枝模型,以實現對多任務神經網絡模型的剪枝。
本發明授權一種多任務神經網絡模型的剪枝方法及裝置在權利要求書中公布了:1.一種多任務神經網絡模型的剪枝方法,其特征在于,所述方法包括: 獲得訓練完成的多任務神經網絡模型,作為待剪枝模型,所述多任務神經網絡模型為能夠實現至少兩種檢測任務的神經網絡模型; 針對所述待剪枝模型的每一卷積層,執行如下步驟A-C,以確定出每一卷積層在不同預設層剪枝率下的敏感度信息; 步驟A:針對各預設層剪枝率,基于該預設層剪枝率以及該卷積層中各卷積核,對該卷積層進行預剪枝; 步驟B:基于第一訓練數據,確定該預設層剪枝率對應的預剪枝后的待剪枝模型所對應各任務損失值,所述第一訓練數據包括樣本圖像及其對應的標定信息,其中,所述樣本圖像包括所述待剪枝模型需要檢測的目標,所述樣本圖像對應的標定信息包括所述待剪枝模型的各任務對應的檢測標簽的具體內容,所述步驟B包括:將所述第一訓練數據中的每一樣本圖像輸入該預設層剪枝率對應的預剪枝后的待剪枝模型中,得到該樣本圖像對應的預測信息,其中,該預測信息包括該待剪枝模型的各任務對應的預測信息;針對每一任務,基于該任務對應的預設損失函數、該樣本圖像對應的該任務對應的預測信息以及第一訓練數據中該樣本圖像對應的該任務對應的標定信息,確定該樣本圖像對應的該任務對應的任務子損失值,以得到該樣本圖像對應的該任務對應的任務子損失值;并針對每一任務,基于各樣本圖像對應的該任務對應的任務子損失值,確定該任務對應的任務損失值; 步驟C:基于預剪枝后的待剪枝模型對應的各任務損失值,確定該卷積層在該預設層剪枝率下的敏感度信息; 基于所述待剪枝模型對應的通道信息,對所述待剪枝模型的卷積層中的卷積核進行分組,其中,在所述待剪枝模型中存在多個卷積層以ElementwiseLayer函數連接的情況下,將對應相同通道標識的卷積核分為一組,對應不同通道標識的卷積核分為不同組,將不以ElementwiseLayer函數連接的卷積層的卷積核分為一組,所述不以ElementwiseLayer函數連接的卷積層的卷積核為不對應通道標識的卷積核; 基于當前的模型剪枝率、所述待剪枝模型的卷積核的分組情況、每一層卷積層中各卷積核對應的剪枝范數值以及每一卷積層在不同層剪枝率下的敏感度信息,確定目標剪枝模型,其中,對于對應同一通道標識的卷積核來說,同時進行剪枝或同時保留,對于不對應通道標識的卷積核來說,基于其對應的剪枝范數值進行剪枝或保留。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人超星未來極摯(上海)科技有限公司,其通訊地址為:201805 上海市嘉定區安亭鎮墨玉南路888號2201室JT1282;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。