杭州電子科技大學殷海兵獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉杭州電子科技大學申請的專利一種支持深度神經網絡加速跨層訪存帶寬優化方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120123274B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510216697.4,技術領域涉及:G06F13/28;該發明授權一種支持深度神經網絡加速跨層訪存帶寬優化方法是由殷海兵;林聚財;黃曉峰;王軍;陳琦;馮杲;殷俊;殷理達;王鴻奎設計研發完成,并于2025-02-26向國家知識產權局提交的專利申請。
本一種支持深度神經網絡加速跨層訪存帶寬優化方法在說明書摘要公布了:本發明涉及神經網絡優化技術領域,尤其涉及一種支持深度神經網絡加速跨層訪存帶寬優化方法,包括:步驟1、設計單層分塊優化和循環順序優化帶寬模型;步驟2、單層獨立分塊優化和循環順序優化;步驟3、跨層聯合分塊優化和循環順序優化;步驟4、復合分塊優化和循環順序優化。本發明可實現最小DRAM訪問的數據分塊策略、循環展開控制策略、數據存儲映射更新策略,實現細顆粒度最大化數據復用的數據訪問和數據流方案,可有效支持實現計算和訪存效率優化的代碼自動生成和計算映射優化。
本發明授權一種支持深度神經網絡加速跨層訪存帶寬優化方法在權利要求書中公布了:1.一種支持深度神經網絡加速跨層訪存帶寬優化方法,其特征在于,包括: 步驟1、設計單層分塊優化和循環順序優化帶寬模型,具體包括: 根據深度卷積計算數據流特點,設定三種數據訪問模式,包括輸入特征圖系數復用IRO模式、輸出特征圖系數復用ORO模式和權重系數復用WRO模式; 根據三種數據訪問模式的數據流特點,設定輸入特征圖、輸出特征圖和權重在各模式下的單次訪問數據量和循環訪問次數; 步驟2、單層獨立分塊優化和循環順序優化,具體包括: 步驟2.1、對單層卷積計算的特征數據進行分塊,獲取分塊參數; 步驟2.2、遍歷所有可能的分塊組合,分別計算三種數據訪問模式下的內存帶寬、存儲占用,并比較存儲閾值和最小內存帶寬,確定最優分塊組合和數據訪問模式; 步驟3、跨層聯合分塊優化和循環順序優化,具體包括: 步驟3.1、遍歷相鄰兩層卷積計算數據的分塊組合,具體包括: 針對第u層和第u+1層即相鄰兩層,先對第u層卷積計算的特征數據進行分塊,獲取第u層分塊組合;再復用第u層的分塊參數,得到第u+1層分塊組合,其中,Twu+1=Tnu,Thu+1=Tmu,即:第u層卷積計算特征圖的寬Tn、高Tm復用為第u+1層卷積計算特征圖的權重參數:Twu+1、Thu+1; 步驟3.2、按照ORO模式循環遍歷計算不同分塊組合相鄰兩層的帶寬和存儲占用,設置存儲約束,按照IRO模式循環遍歷檢查計算的存儲占用是否滿足存儲約束,并選擇總帶寬最小的分塊組合; 步驟4、復合分塊優化和循環順序優化,具體包括: 步驟4.1、先利用所述單層獨立分塊優化和循環順序優化對每一層進行單獨優化,再利用所述跨層聯合分塊優化和循環順序優化對相鄰層進行聯合優化; 步驟4.2、通過比較單獨優化和聯合優化的結果,動態選擇最優的分塊策略。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州電子科技大學,其通訊地址為:310018 浙江省杭州市錢塘區2號大街1158號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。