齊魯工業(yè)大學(山東省科學院);山東省計算中心(國家超級計算濟南中心)田敏獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉齊魯工業(yè)大學(山東省科學院);山東省計算中心(國家超級計算濟南中心)申請的專利申威架構(gòu)上面向CNN的批量矩陣乘并行優(yōu)化方法及系統(tǒng)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN120508740B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-23發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202511020934.6,技術(shù)領(lǐng)域涉及:G06F17/16;該發(fā)明授權(quán)申威架構(gòu)上面向CNN的批量矩陣乘并行優(yōu)化方法及系統(tǒng)是由田敏;張龍;吳曉明;霍吉東;潘景山;郭瑩;杜偉設(shè)計研發(fā)完成,并于2025-07-24向國家知識產(chǎn)權(quán)局提交的專利申請。
本申威架構(gòu)上面向CNN的批量矩陣乘并行優(yōu)化方法及系統(tǒng)在說明書摘要公布了:本發(fā)明提出了申威架構(gòu)上面向CNN的批量矩陣乘并行優(yōu)化方法及系統(tǒng),屬于人工智能并行優(yōu)化技術(shù)領(lǐng)域;包括:將卷積層中的輸入特征圖和卷積核分別轉(zhuǎn)換為輸入矩陣和權(quán)重矩陣,并批量處理為多組獨立的矩陣乘法任務;主核將矩陣乘法任務封裝為參數(shù)結(jié)構(gòu)體數(shù)組,通過單次DMA傳輸至從核,從核根據(jù)線程總數(shù)和矩陣高度,采用動態(tài)行塊劃分算法將輸入矩陣的行劃分為行塊任務;并對分配的獨立行塊執(zhí)行子矩陣乘法計算,采用雙緩沖DMA異步預取矩陣子塊,執(zhí)行矩陣乘累加計算。本發(fā)明能夠提高批量矩陣乘在申威處理器主從核間的并行處理效率,優(yōu)化算法性能。
本發(fā)明授權(quán)申威架構(gòu)上面向CNN的批量矩陣乘并行優(yōu)化方法及系統(tǒng)在權(quán)利要求書中公布了:1.申威架構(gòu)上面向CNN的批量矩陣乘并行優(yōu)化方法,其特征在于,包括:所述并行優(yōu)化方法由主核和多個從核實現(xiàn); 所述主核的實現(xiàn)過程包括: 將CNN卷積層中的輸入特征圖和卷積核分別轉(zhuǎn)換為輸入矩陣和權(quán)重矩陣,并按批量處理形成多組獨立的矩陣乘法任務; 將矩陣乘法任務中的參數(shù)封裝為連續(xù)內(nèi)存的參數(shù)結(jié)構(gòu)體數(shù)組,通過單次DMA傳輸至從核,并觸發(fā)從核程序啟動信號; 所述參數(shù)結(jié)構(gòu)體數(shù)組包含批量大小、矩陣維度參數(shù)、源矩陣內(nèi)存地址以及目標矩陣內(nèi)存地址;其中,所述批量大小與獨立的矩陣乘法任務的組數(shù)相對應; 多個所述從核的實現(xiàn)過程包括: 異步讀取所述參數(shù)結(jié)構(gòu)體數(shù)組并自主推導任務范圍;根據(jù)線程總數(shù)和矩陣高度,采用動態(tài)行塊劃分算法將輸入矩陣的行劃分為行塊任務,每個從核線程按線程ID分配獨立行塊; 動態(tài)行塊劃分的數(shù)學公式表示為: ; 其中,表示每個線程需要處理的矩陣乘任務的行數(shù),表示線程ID,表示所分配的從核線程數(shù),表示矩陣高度; 所述動態(tài)行塊劃分算法的執(zhí)行過程包括:計算輸入矩陣的基礎(chǔ)行數(shù)和余量行數(shù),若從核線程的線程ID小于余量行數(shù),則分配行數(shù)在基礎(chǔ)行數(shù)的基礎(chǔ)上加1,此時,起始行等于線程ID與所分配行數(shù)的乘積;若從核線程的線程ID不小于余量行數(shù),則分配行數(shù)與基礎(chǔ)行數(shù)一致,此時,起始行等于線程ID與所分配行數(shù)的乘積的基礎(chǔ)上,與余量行數(shù)的相加值; 對分配的獨立行塊執(zhí)行子矩陣乘法計算,并采用雙緩沖DMA異步預取輸入矩陣和權(quán)重矩陣的矩陣子塊,執(zhí)行矩陣乘累加計算,完成后將結(jié)果回傳主存; 所述雙緩沖DMA的執(zhí)行過程包括:分別為輸入矩陣和權(quán)重矩陣的子塊分配兩個LDM緩沖區(qū);在計算當前子塊時,異步預取下一子塊至空閑緩沖區(qū);通過DMA同步指令確保當前計算數(shù)據(jù)就緒,交替切換計算緩沖區(qū)與預取緩沖區(qū)。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人齊魯工業(yè)大學(山東省科學院);山東省計算中心(國家超級計算濟南中心),其通訊地址為:250000 山東省濟南市長清區(qū)大學路3501號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。