摘要:
针对当前主流的剪枝方法所获得的压缩模型推理时间较长和效果较差的问题, 提出一种易用且性能优异的层剪枝方法。该方法将原始卷积层转化为可融合残差卷积块, 然后通过稀疏化训练的方法实现层剪枝, 得到一种具有工程易用性的层剪枝方法, 兼具推理时间短和剪枝效果好的优点。实验结果表明, 在图像分类任务和目标检测任务中, 该方法可使模型在精度损失较小的情况下获得极高的压缩率, 优于先进的卷积核剪枝方法。
徐鹏涛, 曹健, 孙文宇, 李普, 王源, 张兴. 基于可融合残差卷积块的深度神经网络模型层剪枝方法[J]. 北京大学学报自然科学版, 2022, 58(5): 801-807.
XU Pengtao, CAO Jian, SUN Wenyu, LI Pu, WANG Yuan, ZHANG Xing. Layer Pruning via Fusible Residual Convolutional Block for Deep Neural Networks[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(5): 801-807.