###
DOI:
计算机系统应用英文版:2010,19(5):116-120
本文二维码信息
码上扫一扫!
GPU上稀疏矩阵与矢量乘积运算的一种改进
(1.复旦大学 计算机科学技术学院 上海 200433;2.上海理工大学 计算机科学工程系 上海 2000933)
Improvement of Sparse Matrix-Vector Multiplication on GPU
摘要
图/表
参考文献
相似文献
本文已被:浏览 1719次   下载 5128
Received:September 10, 2009    Revised:October 25, 2009
中文摘要: 稀疏矩阵和矢量的乘积运算在工程实践及科学计算中经常用到,随着矩阵规模的增长,大量的计算限制了整个系统的性能,因此可以利用GPU的高运算能力加速SpMV。分析了现有GPU上实现的SpMV存在的问题,并设计了行分割优化和float4数据类型优化两种方案。实验表明,该方案可以使性能提升2~8倍。
中文关键词: GPU  稀疏矩阵  CSR  CUDA
Abstract:Sparse Matrix-vector multiplication (SpMV) is one of the most frequently used kernels in engineering practice and scientific computing. With the growth of the scale matrix, a large number of calculations restrict the performance of system, so SpMV can be accelerated by utilizing the high computing power of GPU. In this paper, the problem of existing SpMV on GPU is analyzed. Besides, row partition optimization and float4 optimization are designed. Experimental results demonstrate that the proposed approach can enhance the performance by 2-8 times.
keywords: GPU  sparse matrix  CSR  CUDA
文章编号:     中图分类号:    文献标志码:
基金项目:
引用文本:
马超,韦刚,裴颂文,吴百锋.GPU上稀疏矩阵与矢量乘积运算的一种改进.计算机系统应用,2010,19(5):116-120
MA Chao,WEI Gang,PEI Song-Wen,WU Bai-Feng.Improvement of Sparse Matrix-Vector Multiplication on GPU.COMPUTER SYSTEMS APPLICATIONS,2010,19(5):116-120