A Hardware Accelerator for SSD Object Detection Algorithm Based on FPGA

doi:10.13209/j.0479-8023.2022.096

Acta Scientiarum Naturalium Universitatis Pekinensis ›› 2022, Vol. 58 ›› Issue (6): 1015-1022.DOI: 10.13209/j.0479-8023.2022.096

Previous Articles Next Articles

A Hardware Accelerator for SSD Object Detection Algorithm Based on FPGA

XIE Hao¹, CAO Jian^1,†, LI Pu¹, ZHAO Xiongbo², ZHANG Xing^1,†

1. School of Software & Microelectronics, Peking University, Beijing 102600 2. Beijing Aerospace Automatic Control Institute, Beijing 100854

Received:2022-01-13 Revised:2022-06-07 Online:2022-11-20 Published:2022-11-20
Contact: CAO Jian, E-mail: caojian(at)ss.pku.edu.cn, ZHANG Xing, E-mail: zhx(at)pku.edu.cn

基于FPGA的SSD目标检测硬件加速器设计

谢豪¹, 曹健^1,†, 李普¹, 赵雄波², 张兴^1,†

1. 北京大学软件与微电子学院, 北京 102600 2. 北京航天自动控制研究所, 北京 100854

通讯作者: 曹健, E-mail: caojian(at)ss.pku.edu.cn, 张兴, E-mail: zhx(at)pku.edu.cn
基金资助:
国家自然科学基金(U20A20204)资助

Abstract

Abstract:

A hardware accelerator of object detection algorithm based on FPGA is designed to accelerate the computation of SSD object detection algorithm. Loop tiling and loop unrolling are used to optimize the loops of convolution and pooling, and can be re-configurated in any parallelism. In order to reduce data transmission time, feature maps are reorganized based on AXI, without any hardware resource overhead. After implementing the hardware accelerator to Xilinx ZCU development board, it can accelerate SSD at a performance of 534.72 GOPS, and the inference time is 113.81 ms.

Key words: convolutional neural network, object detection, hardware acceleration, field programmable gate array (FPGA), ARM

摘要：

设计了一种基于FPGA的目标检测算法的硬件加速器, 采用循环分块和循环展开的方式来优化卷积池化循环, 可以以任意并行度进行卷积和池化计算。使用一种基于AXI总线的数据重排序方式, 在不带来额外硬件资源开销的情况下, 对特征图进行重排序, 可以降低数据传输时间。将该硬件加速器部署至Xilinx ZCU 102开发板进行验证, 结果表明SSD算法前向推理性能为534.72 GOPS, 推理时间为113.81 ms。

关键词: 卷积神经网络, 目标检测, 硬件加速, 现场可编程门阵列, ARM

XIE Hao, CAO Jian, LI Pu, ZHAO Xiongbo, ZHANG Xing. A Hardware Accelerator for SSD Object Detection Algorithm Based on FPGA[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(6): 1015-1022.

谢豪, 曹健, 李普, 赵雄波, 张兴. 基于FPGA的SSD目标检测硬件加速器设计[J]. 北京大学学报自然科学版, 2022, 58(6): 1015-1022.

Add to citation manager EndNote|Ris|BibTeX

URL: https://xbna.pku.edu.cn/EN/10.13209/j.0479-8023.2022.096

https://xbna.pku.edu.cn/EN/Y2022/V58/I6/1015

[1]	DING Yawei, CAO Jian, LI Qibin, FENG Shuo, YANG Chentao, WANG Yuan, ZHANG Xing. Design of Acceleration Unit of Encoding and Frame Generation for PAICORE2.0 [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(5): 786-798.
[2]	LIU Xiangcheng, CAO Jian, YAO Hongyi, XU Pengtao, ZHANG Yuan, WANG Yuan. AdaPruner: Adaptive Channel Pruning and Effective Weights Inheritance [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2023, 59(5): 764-772.
[3]	ZHOU Xiangyu, MAO Shanjun, LI Mei. Bearing Fault Diagnosis Method Based on Down-Sampling in Frequency Domain and CNN [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2023, 59(2): 251-260.
[4]	LI Fang, CAO Jian, LI Pu, XIE Hao, ZHAO Xiongbo, WANG Yuan, ZHANG Xing. Design and Implementation of Object Detection Acceleration Module Based on an ARM+FPGA Heterogeneous Platform [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(6): 1035-1041.
[5]	XU Pengtao, CAO Jian, CHEN Weiqian, LIU Shengrong, WANG Yuan, ZHANG Xing. Post Training Quantization Preprocessing Method of Convolutional Neural Network via Outlier Removal [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(5): 808-812.
[6]	XU Pengtao, CAO Jian, SUN Wenyu, LI Pu, WANG Yuan, ZHANG Xing. Layer Pruning via Fusible Residual Convolutional Block for Deep Neural Networks [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(5): 801-807.
[7]	SUN Wenyu, CAO Jian, LI Pu, LIU Rui. Pruning and Fine-tuning Optimization Method of Convolutional Neural Network Based on Global Information [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2021, 57(4): 790-794.
[8]	LI Xingya, CHEN Yufeng, XU Jin’an, ZHANG Yujie. Distant Supervision for Relation Extraction with Gate Mechanism [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(1): 39-44.
[9]	ZHANG Qinglin, DU Jiachen, XU Ruifeng. Sarcasm Detection Based on Adversarial Learning [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(1): 29-36.
[10]	XU Haoliang, LI Yanqun, HE Yunqi, QIAN Longhua. Research on Chinese Nested Named Entity Relation Extraction [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(1): 8-14.
[11]	LUO Fan, WANG Houfeng. Chinese Text Sentiment Classification by H-RNN-CNN [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2018, 54(3): 459-465.
[12]	Wenhao YING, Xinyan XIAO, Sujian LI, Yajuan LÜ, Zhifang SUI. Improving Query-Focused Summarization with CNN-Based Similarity [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2017, 53(2): 197-203.

A Hardware Accelerator for SSD Object Detection Algorithm Based on FPGA

基于FPGA的SSD目标检测硬件加速器设计

PDF

Knowledge

Abstract

Cite this article

share this article

References

Related Articles 12

Recommended Articles

Metrics