阿里巴巴集團控股有限公司趙曉輝獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉阿里巴巴集團控股有限公司申請的專利處理單元、相關裝置和方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN113313242B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202010125529.1,技術領域涉及:G06N3/063;該發明授權處理單元、相關裝置和方法是由趙曉輝;尹莉設計研發完成,并于2020-02-27向國家知識產權局提交的專利申請。
本處理單元、相關裝置和方法在說明書摘要公布了:本公開提出一種處理單元、相關裝置和方法。該處理單元包括:取指令單元,用于取回計算機指令;指令譯碼單元,用于對取回的計算機指令進行譯碼;指令執行單元,用于執行譯碼后的所述計算機指令,以實現:將特定格式的深度學習模型轉換成通用中間表達;在所述通用中間表達中插入最大最小值收集節點;將插入了所述最大最小值收集節點的通用中間表達轉換回所述特定格式進行校準,得到所述待量化輸入的最大值、最小值;根據得到的待量化輸入的最大值、最小值,在所述通用中間表達中插入量化和反量化節點;將插入了量化節點和反量化節點的通用中間表達轉換回特定格式,得到量化后模型。本公開提高了加速單元的量化的通用性。
本發明授權處理單元、相關裝置和方法在權利要求書中公布了:1.一種處理單元,用于確定適于計算裝置中加速單元運行的模型,降低對數據吞吐量和存儲空間的要求,其中,所述處理單元包括: 取指令單元,用于從所述處理單元外部的存儲器取回計算機指令; 指令譯碼單元,用于對取回的計算機指令進行譯碼; 指令執行單元,用于執行譯碼后的所述計算機指令,以實現:將特定格式的深度學習模型轉換成通用中間表達;在所述通用中間表達中插入最大最小值收集節點,用于收集待量化輸入的最大值、最小值;將插入了所述最大最小值收集節點的通用中間表達轉換回所述特定格式進行校準,得到所述待量化輸入的最大值、最小值;根據得到的待量化輸入的最大值、最小值,在所述通用中間表達中插入量化和反量化節點;將插入了量化節點和反量化節點的通用中間表達轉換回特定格式,得到量化后模型,將量化后模型按照加速單元支持的指令集,轉換成加速單元模型;其中,所述加速單元為加速深度學習模型的運算處理速度而設計的單元; 其中,處理單元通過指令的形式向加速單元發送加速單元模型的權重在存儲器中的地址,以使得加速單元在運行加速單元模型進行推理時,按照所述地址直接從存儲器中取出權重,通過加速單元的片上內核運行;所述處理單元還用于在推理時將輸入數據從高精度數據類型轉換為低精度數據類型,通過指令的形式向加速單元通知低精度數據類型的輸入在存儲器中的地址,便于加速單元利用基于所述輸入數據進行推理; 其中,所述根據得到的待量化輸入的最大值、最小值,在所述通用中間表達中插入量化和反量化節點,包括: 根據得到的待量化輸入的最大值、最小值,確定量化因素; 根據所述量化因素,生成量化節點和反量化節點插入所述通用中間表達; 其中,所述量化節點被加入到量化版本的操作節點前,用于對操作節點的輸入以及操作節點中的權重參數進行量化,所述反量化節點被加入到量化版本的操作節點后,用于對操作節點的輸出進行反量化操作。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人阿里巴巴集團控股有限公司,其通訊地址為:英屬開曼群島大開曼資本大廈一座四層847號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。