面向硬件加速的通用图像卷积实验平台
作者:
基金项目:

国家自然科学基金(61201216); 福建省教师教育科研项目(JAT191117); 泉州市科技计划(2017T009); 福建师范大学协和学院科研基金(KY20200202)


Hardware Acceleration Oriented General Experiment Platform of Image Convolution
Author:
  • 摘要
  • | |
  • 访问统计
  • |
  • 参考文献 [6]
  • |
  • 相似文献 [20]
  • | | |
  • 文章评论
    摘要:

    FPGA因具有较好的并行处理能力和灵活性, 使其在卷积神经网络硬件加速计算中得到广泛的应用, 但是传统的FPGA图像卷积实现中存在模块化设计以及空间开销较大的问题. 本文提出了一种面向硬件加速的通用图像卷积开发平台. 通过模块化设计, 极大提高针对不同卷积核实现图像卷积开发的灵活性; 另外通过图像批次处理技术, 充分利用数据重复性实现内存共享, 较好地降低了存储空间的开销. 实验结果表明, 本文设计的平台在模块化设计方面提供了更好的可重配置架构, 非常适于实验教学应用; 在存储空间需求方面, 当并行度提高时, BRAM的复杂度只是线性增加, 这对于功耗的降低具有优势.

    Abstract:

    With fine parallel processing capability and flexibility, Field Programmable Gate Array (FPGA) has been widely applied to hardware-accelerated computation, especially in Convolution Neural Networks (CNN). However, traditional image convolution on FPGA has limited modular design and large space overhead. This study builds a general experiment platform of image convolution for hardware acceleration. Through the modular design, it greatly improves the flexibility in image convolution for different convolution kernels. In addition, an image batch-processing system is adopted to enable memory sharing due to data repetition, reducing the need for storage space. Experimental results present that the proposed platform boasts a better reconfigurable architecture in terms of modular design. Besides, the complexity of BRAM only increases linearly with higher parallelism, which has the advantage of reducing power consumption.

    参考文献
    [1] Aguilar-González A, Arias-Estrada M, Pérez-Patricio M, et al. An FPGA 2D-convolution unit based on the CAPH language. Journal of Real-time Image Processing, 2019, 16(2): 305–319. [doi: 10.1007/s11554-015-0535-1
    [2] Abdelouahab K, Pelcat M, Sérot J, et al. Tactics to directly map CNN graphs on embedded FPGAs. IEEE Embedded Systems Letters, 2017, 9(4): 113–116. [doi: 10.1109/LES.2017.2743247
    [3] Sriram VB, Sawant R, Kamath K, et al. Implementation of 2D convolution algorithm on FPGA for image processing application. International Journal of Electrical, Electronics and Data Communication, 2015, 3(12): 22–25
    [4] 卢冶, 陈瑶, 李涛, 等. 面向边缘计算的嵌入式FPGA卷积神经网络构建方法. 计算机研究与发展, 2018, 55(3): 551–562. [doi: 10.7544/issn1000-1239.2018.20170715
    [5] 曾成龙, 刘强. 面向嵌入式FPGA的高性能卷积神经网络加速器设计. 计算机辅助设计与图形学学报, 2019, 30(9): 1645–1652
    [6] 李小燕, 张欣, 闫小兵, 等. 基于FPGA的卷积神经网络加速系统. 河北大学学报(自然科学版), 2019, 39(1): 99–105
    引证文献
    网友评论
    网友评论
    分享到微博
    发 布
引用本文

阚保强.面向硬件加速的通用图像卷积实验平台.计算机系统应用,2021,30(2):77-82

复制
分享
文章指标
  • 点击次数:736
  • 下载次数: 2006
  • HTML阅读次数: 1110
  • 引用次数: 0
历史
  • 收稿日期:2020-06-15
  • 最后修改日期:2020-07-15
  • 在线发布日期: 2021-01-29
文章二维码
您是第11274392位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号