面向硬件加速的通用图像卷积实验平台
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金(61201216); 福建省教师教育科研项目(JAT191117); 泉州市科技计划(2017T009); 福建师范大学协和学院科研基金(KY20200202)


Hardware Acceleration Oriented General Experiment Platform of Image Convolution
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    FPGA因具有较好的并行处理能力和灵活性, 使其在卷积神经网络硬件加速计算中得到广泛的应用, 但是传统的FPGA图像卷积实现中存在模块化设计以及空间开销较大的问题. 本文提出了一种面向硬件加速的通用图像卷积开发平台. 通过模块化设计, 极大提高针对不同卷积核实现图像卷积开发的灵活性; 另外通过图像批次处理技术, 充分利用数据重复性实现内存共享, 较好地降低了存储空间的开销. 实验结果表明, 本文设计的平台在模块化设计方面提供了更好的可重配置架构, 非常适于实验教学应用; 在存储空间需求方面, 当并行度提高时, BRAM的复杂度只是线性增加, 这对于功耗的降低具有优势.

    Abstract:

    With fine parallel processing capability and flexibility, Field Programmable Gate Array (FPGA) has been widely applied to hardware-accelerated computation, especially in Convolution Neural Networks (CNN). However, traditional image convolution on FPGA has limited modular design and large space overhead. This study builds a general experiment platform of image convolution for hardware acceleration. Through the modular design, it greatly improves the flexibility in image convolution for different convolution kernels. In addition, an image batch-processing system is adopted to enable memory sharing due to data repetition, reducing the need for storage space. Experimental results present that the proposed platform boasts a better reconfigurable architecture in terms of modular design. Besides, the complexity of BRAM only increases linearly with higher parallelism, which has the advantage of reducing power consumption.

    参考文献
    相似文献
    引证文献
引用本文

阚保强.面向硬件加速的通用图像卷积实验平台.计算机系统应用,2021,30(2):77-82

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-06-15
  • 最后修改日期:2020-07-15
  • 录用日期:
  • 在线发布日期: 2021-01-29
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号