Design and Implementation of Object Detection Acceleration Module Based on an ARM+FPGA Heterogeneous Platform

doi:10.13209/j.0479-8023.2022.089

Acta Scientiarum Naturalium Universitatis Pekinensis ›› 2022, Vol. 58 ›› Issue (6): 1035-1041.DOI: 10.13209/j.0479-8023.2022.089

Previous Articles Next Articles

Design and Implementation of Object Detection Acceleration Module Based on an ARM+FPGA Heterogeneous Platform

LI Fang¹, CAO Jian^1,†, LI Pu¹, XIE Hao¹, ZHAO Xiongbo², WANG Yuan^3,†, ZHANG Xing^1,†

1. School of Software & Microelectronics, Peking University, Beijing 102600 2. Beijing Aerospace Automatic Control Institute, Beijing 100070 3. School of Integrated Circuits, Peking University, Beijing 100871

Received:2021-12-20 Revised:2022-05-18 Online:2022-11-20 Published:2022-11-20
Contact: CAO Jian, E-mail: caojian(at)ss.pku.edu.cn, WANG Yuan, E-mail: wangyuan(at)pku.edu.cn,ZHANG Xing, E-mail: zhx(at)pku.edu.cn

基于ARM+FPGA异构平台的目标检测加速模块设计与实现

李放¹, 曹健^1,†, 李普¹, 谢豪¹, 赵雄波², 王源^3,†, 张兴^1,†

1. 北京大学软件与微电子学院, 北京 102600 2. 北京航天自动控制研究所, 北京 100070 3. 北京大学集成电路学院, 北京 100871

通讯作者: 曹健, E-mail: caojian(at)ss.pku.edu.cn, 王源, E-mail: wangyuan(at)pku.edu.cn,张兴, E-mail: zhx(at)pku.edu.cn
基金资助:
国家重点研发计划项目(2018YFE0203801)资助

Abstract

Abstract:

Object detection algorithms based on deep learning use big models are difficult to be deployed at the edge. Taking YOLO (you only look once) object detection algorithm as an example, an acceleration module based on an ARM+FPGA heterogeneous platform is proposed. The FPGA chip accelerates the forward process of the compressed model while ARM is responsible for process scheduling. Experiment results show that the peak performance of the system reaches 425.8 GOP/s under 200 MHz working frequency. The system on a Xilinx ZCU102 board achieves a frame rate at 30.3 fps, while the power consumption is 3.56 W. It is also configurable.

Key words: deep learning, object detection, model pruning and quantization, heterogeneous platform, edge computing

摘要：

为解决基于深度学习目标检测模型规模大、在边缘设备上难以部署的问题, 以YOLO目标检测模型为例, 设计实现基于ARM+FPGA异构平台的目标检测加速模块。该系统使用剪枝、量化后的压缩模型, 在FPGA实现神经网络前向推理加速, 在ARM中实现加速器调度。实验结果表明, 部署至Xilinx ZCU102开发板上, 该模块在200 MHz工作频率下, 平均计算性能达到425.8 GOP/s, 推理压缩模型速度达到30.3 fps, 模块功耗为3.56 W, 证明该加速模块具备可配置性。

关键词: 深度学习, 目标检测, 模型剪枝量化, 异构平台, 边缘计算

LI Fang, CAO Jian, LI Pu, XIE Hao, ZHAO Xiongbo, WANG Yuan, ZHANG Xing. Design and Implementation of Object Detection Acceleration Module Based on an ARM+FPGA Heterogeneous Platform[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(6): 1035-1041.

李放, 曹健, 李普, 谢豪, 赵雄波, 王源, 张兴. 基于ARM+FPGA异构平台的目标检测加速模块设计与实现[J]. 北京大学学报自然科学版, 2022, 58(6): 1035-1041.

Add to citation manager EndNote|Ris|BibTeX

URL: https://xbna.pku.edu.cn/EN/10.13209/j.0479-8023.2022.089

https://xbna.pku.edu.cn/EN/Y2022/V58/I6/1035

[1]	WANG Tairan, BAO Yifei. Micro-earthquake Recording Denoising Method Based on Convolutional Neural and Bidirectional Long Short-term Memory Network [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2025, 61(3): 487-500.
[2]	JI Rui, MA Lei, ZHANG Jing, WANG Weihong, GUO Zhizhou, WAN Xianci, XIAO Lei, WAN Wei. Synthesis of Remote Sensing Optical Images with Ship Targets Based on Generative Adversarial Networks [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(5): 883-892.
[3]	ZHANG Fengshuo, LI Yu, LI Xiangqian, XU Jin’an, CHEN Yufeng. Reducing Multi-model Biases for Robust Visual Question Answering [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(1): 23-33.
[4]	LI Dai, WANG Tianmu, ZHANG Si, QIN Yue, XIE Fugui, LIU Xinjun, NIE Zhenguo, HUANG Hongshi. Intelligent Diagnosis on Anterior Cruciate Ligament Deficiency Based on Plantar Pressure and ConvLSTM Neural Network [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(1): 109-117.
[5]	YAO Zhaoyuan, MA Lei, WAN Wei, SONG Benqin, WANG Weihong, DENG Jiwei, XIAO Lei, JI Rui, WEI Zhihao, CUI Yaokui. Consistency Assessment of Remote Sensing Dataset Based on Deep Learning [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2023, 59(4): 563-568.
[6]	ZHOU Xiangyu, MAO Shanjun, LI Mei. Bearing Fault Diagnosis Method Based on Down-Sampling in Frequency Domain and CNN [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2023, 59(2): 251-260.
[7]	XIE Hao, CAO Jian, LI Pu, ZHAO Xiongbo, ZHANG Xing. A Hardware Accelerator for SSD Object Detection Algorithm Based on FPGA [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(6): 1015-1022.
[8]	SUN Wenyu, CAO Jian, LI Pu, LIU Rui. Pruning and Fine-tuning Optimization Method of Convolutional Neural Network Based on Global Information [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2021, 57(4): 790-794.
[9]	LI Tianran, LIU Mingtong, ZHANG Yujie, XU Jin’an, CHEN Yufeng. A Review of Entity Linking Research Based on Deep Learning [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2021, 57(1): 91-98.
[10]	HUANG Depeng, LI Zhenghua, GONG Chen, ZHANG Min. Neural Network Coupled Model for Conversion and Exploitation of Heterogeneous Lexical Annotations [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(1): 97-104.
[11]	HUANG Hongshi, WANG Zhengfei, XU Guoxiong, LI Wenxin, ZHANG Si, ZHANG Dongxia, AO Yingfang. Anterior Cruciate Ligament Deficiency Auxiliary Diagnosis Based on Plantar Pressure Information during Walking [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(5): 859-864.
[12]	FANG Haiquan, JIANG Yunzhong, YE Yuntao, CAO Yin. River Extraction from High-Resolution Satellite Images Combining Deep Learning and Multiple Chessboard Segmentation [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(4): 692-698.
[13]	CAI Zhenyu, GE Zengxi. Using Artificial Intelligence to Pick P-Wave First-Arrival of the Microseisms: Taking the Aftershock Sequence of Wenchuan Earthquake as an Example [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(3): 451-460.
[14]	LI Xiaojun, SHI Hanxiao, CHEN Nannan, LIU Hong, ZOU Yi. Research on Sentiment Analysis Based on Representation Learning [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(1): 105-112.
[15]	WANG Qiansheng, YU Nan, ZHANG Meishan, HAN Zijia, FU Guohong. N3LDG: A Lightweight Neural Network Library for Natural Language Processing [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(1): 113-119.

Design and Implementation of Object Detection Acceleration Module Based on an ARM+FPGA Heterogeneous Platform

基于ARM+FPGA异构平台的目标检测加速模块设计与实现

PDF

Knowledge

Abstract

Cite this article

share this article

References

Related Articles 15

Recommended Articles

Metrics