摘要:
提出一种基于改进型LeNet的交通标志多分类异构加速器的实现方案。该加速器利用ARM+FPGA异构平台, 将改进型LeNet的前向推理部署到FPGA上, 实现并行计算。在FPGA端, 采用AXI-Stream协议, 通过DMA实现数据高速流转, 使用数组分区和多级流水线 等技术实现数据的并行处理。 在ARM端使用PYNQ框架进行数据更新和加速器调度。在GTSRB数据集上的实验结果显示, 该设计方案在工作时钟频率为50 MHz时, 平均推理时间为14.489 ms, 在MCU上的推理时间为710 ms, 加速比可达49, 对于实现交通标识多分类的边缘端应用具有显著的作用。
杨永杰, 郑君泰, 马立, 杨昊. 一种改进型LeNet的交通标识多分类异构加速器的实现[J]. 北京大学学报自然科学版, 2024, 60(6): 1001-1008.
YANG Yongjie, ZHENG Juntai, MA Li, YANG Hao. Implementation of an Improved LeNet Traffic Sign Multi-classification Heterogeneous Accelerator[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(6): 1001-1008.