在 CFU Playground 上加速 MLPerf™ Tiny 影像分類模型 #6:軟硬體結合加速接下來我們將會開始結合前面提到的乘法加速單元以及軟體加速技巧來最大化模型推理的效率。在筆者的加速器設計中包含五條與矩陣乘法單元有關的指令,以及三條跟 TFLite int8 量化處理有關的指令,我們將會看到筆者在設計這些指令時考慮到軟硬體複雜度而做的取捨。Feb 16Feb 16
在 CFU Playground 上加速 MLPerf™ Tiny 影像分類模型 #5:純軟體加速在開始加上應用硬體加速前,先讓我們看看純軟體改進能做到多快的加速,畢竟在軟體上進行最佳化的難度和時間花費總是比寫個硬體加速器來得簡單,而且也能讓我們在之後看到需要的運算能夠被硬體加速的寶貴。Jan 8Jan 8
在 CFU Playground 上加速 MLPerf™ Tiny 影像分類模型 #0:前言本文基於筆者在實作交大機器學習晶片架構設計的作業與期末專題之經驗所寫成,內容涵蓋硬體加速器設計與軟體程式碼之修改與最佳化,在 CFU Playground 配套的 CPU VexRiscv_FullCfu @ 75MHz 上,筆者成功將 MLPerf™ Tiny…Jan 8Jan 8