南京航空航天大學(xué);南京航空航天大學(xué)深圳研究院陳志成獲國(guó)家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉南京航空航天大學(xué);南京航空航天大學(xué)深圳研究院申請(qǐng)的專利面向DSP平臺(tái)的大尺寸二維卷積算子加速方法獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN120409583B 。
龍圖騰網(wǎng)通過國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-12發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202510916708.X,技術(shù)領(lǐng)域涉及:G06N3/063;該發(fā)明授權(quán)面向DSP平臺(tái)的大尺寸二維卷積算子加速方法是由陳志成;朱岱寅設(shè)計(jì)研發(fā)完成,并于2025-07-03向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本面向DSP平臺(tái)的大尺寸二維卷積算子加速方法在說明書摘要公布了:本發(fā)明公開了一種面向DSP平臺(tái)的大尺寸二維卷積算子加速方法,屬于數(shù)字信號(hào)處理領(lǐng)域。該方法根據(jù)卷積類型選擇im2col或col2im算法重排數(shù)據(jù);采用三段矩陣分塊策略適配L3緩存容量;利用EDMA緩沖乒乓架構(gòu),實(shí)現(xiàn)數(shù)據(jù)傳輸與計(jì)算的流水線并行;SIMD指令級(jí)優(yōu)化,基于DMPYSP和DADDSP指令配合流水優(yōu)化實(shí)現(xiàn)單周期4個(gè)FP32乘法運(yùn)算和加法運(yùn)算;多核并行調(diào)度,通過OpenMP實(shí)現(xiàn)任務(wù)級(jí)和數(shù)據(jù)級(jí)并行。該方法在TITMS320C6678平臺(tái)實(shí)測(cè)可實(shí)現(xiàn)SAR目標(biāo)檢測(cè)網(wǎng)絡(luò)的高效推理,為在DSP平臺(tái)上CNN網(wǎng)絡(luò)的實(shí)時(shí)推理提供可行方案。
本發(fā)明授權(quán)面向DSP平臺(tái)的大尺寸二維卷積算子加速方法在權(quán)利要求書中公布了:1.一種面向DSP平臺(tái)的大尺寸二維卷積算子加速方法,其特征在于,包括以下步驟: 1),動(dòng)態(tài)數(shù)據(jù)重排:根據(jù)卷積類型選擇im2col算法或col2im算法重排數(shù)據(jù); 2),緩存管理策略:采用三段矩陣分塊策略適配L3緩存容量; 3),利用EDMA緩沖乒乓架構(gòu),將計(jì)算與傳輸?shù)牧魉€并行執(zhí)行;具體包括: 緩存分配策略: 將三段矩陣分塊策略分配在L3_Cache中的三段分塊進(jìn)行復(fù)制,得到大小和形狀完全相同的兩份三段緩存,分別稱為緩存乒和緩存乓,后綴ping表示緩存乒,后綴pong表示緩存乓; 要求M_ping、N_ping和K_ping滿足下面條件: M_ping*N_ping+K_ping*N_ping+M_ping*K_ping*sizeofdata_typeL3_Cache_Size*0.4; 其中,M_ping、N_ping和K_ping為子矩陣的維度,分別取值為M、N和K的因數(shù);sizeofdata_type指矩陣元素的數(shù)據(jù)類型的大小,單位為字節(jié);L3_Cache_Size指可供使用的L3緩存的大小,單位為字節(jié); 同時(shí)M_pong、N_pong、K_pong和M_ping、N_ping、K_ping取值完全一致; EDMA與GEMM配合策略: 1按照三段矩陣分塊策略選擇輸出矩陣、輸入矩陣、權(quán)重矩陣的分塊; 2選擇緩存乒乓; 3EDMA從DDR傳入分塊的輸入子矩陣和權(quán)重子矩陣到緩存乒乓; 4GEMM計(jì)算獲得輸出子矩陣; 5EDMA從緩存乒乓傳出分塊的輸出子矩陣到DDR; 6若分塊子矩陣沒有遍歷完,回到1,交換緩存乒乓,直到子矩陣遍歷結(jié)束,完成整個(gè)矩陣的計(jì)算; 4),SIMD指令級(jí)優(yōu)化,基于DSP的DMPYSP和DADDSP指令配合流水優(yōu)化實(shí)現(xiàn)單周期4個(gè)FP32乘法運(yùn)算和加法運(yùn)算; 5),多核并行調(diào)度,結(jié)合OpenMP動(dòng)態(tài)負(fù)載均衡技術(shù)實(shí)現(xiàn)多核并行加速。
如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人南京航空航天大學(xué);南京航空航天大學(xué)深圳研究院,其通訊地址為:210016 江蘇省南京市秦淮區(qū)御道街29號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 根馬布私人有限公司F.貝烏爾肯斯獲國(guó)家專利權(quán)
- 索尼半導(dǎo)體解決方案公司星野和弘獲國(guó)家專利權(quán)
- 三星電子株式會(huì)社郭瑩宇獲國(guó)家專利權(quán)
- 深圳市大疆創(chuàng)新科技有限公司蘇冠華獲國(guó)家專利權(quán)
- 米迪繆尼有限公司R·卡卡獲國(guó)家專利權(quán)
- 高通股份有限公司陳萬士獲國(guó)家專利權(quán)
- 華為技術(shù)有限公司陶強(qiáng)獲國(guó)家專利權(quán)
- IDAC控股公司葉春宣獲國(guó)家專利權(quán)
- 深圳市大疆創(chuàng)新科技有限公司劉渭鋒獲國(guó)家專利權(quán)
- 浙江順動(dòng)科技有限公司年珩獲國(guó)家專利權(quán)


熱門推薦
- 華為技術(shù)有限公司陳普獲國(guó)家專利權(quán)
- 美光科技公司張揚(yáng)獲國(guó)家專利權(quán)
- 亞歷克西斯·達(dá)科斯塔亞歷克西斯·達(dá)科斯塔獲國(guó)家專利權(quán)
- 英特爾公司G·A·格拉斯獲國(guó)家專利權(quán)
- 蘋果公司I·A·喬德里獲國(guó)家專利權(quán)
- 華為技術(shù)有限公司龔磊獲國(guó)家專利權(quán)
- 株式會(huì)社KT李培根獲國(guó)家專利權(quán)
- 浙江集英精密機(jī)器有限公司盧建偉獲國(guó)家專利權(quán)
- 浙江紹興蘇泊爾生活電器有限公司丁金炬獲國(guó)家專利權(quán)
- 株式會(huì)社KT李培根獲國(guó)家專利權(quán)