本文已被:浏览 1880次 下载 5589次
Received:September 10, 2009 Revised:October 25, 2009
Received:September 10, 2009 Revised:October 25, 2009
中文摘要: 稀疏矩阵和矢量的乘积运算在工程实践及科学计算中经常用到,随着矩阵规模的增长,大量的计算限制了整个系统的性能,因此可以利用GPU的高运算能力加速SpMV。分析了现有GPU上实现的SpMV存在的问题,并设计了行分割优化和float4数据类型优化两种方案。实验表明,该方案可以使性能提升2~8倍。
Abstract:Sparse Matrix-vector multiplication (SpMV) is one of the most frequently used kernels in engineering practice and scientific computing. With the growth of the scale matrix, a large number of calculations restrict the performance of system, so SpMV can be accelerated by utilizing the high computing power of GPU. In this paper, the problem of existing SpMV on GPU is analyzed. Besides, row partition optimization and float4 optimization are designed. Experimental results demonstrate that the proposed approach can enhance the performance by 2-8 times.
keywords: GPU sparse matrix CSR CUDA
文章编号: 中图分类号: 文献标志码:
基金项目:
Author Name | Affiliation |
MA Chao | 复旦大学 计算机科学技术学院 上海 200433 |
WEI Gang | 复旦大学 计算机科学技术学院 上海 200433 |
PEI Song-Wen | 上海理工大学 计算机科学工程系 上海 2000933 |
WU Bai-Feng | 复旦大学 计算机科学技术学院 上海 200433 |
Author Name | Affiliation |
MA Chao | 复旦大学 计算机科学技术学院 上海 200433 |
WEI Gang | 复旦大学 计算机科学技术学院 上海 200433 |
PEI Song-Wen | 上海理工大学 计算机科学工程系 上海 2000933 |
WU Bai-Feng | 复旦大学 计算机科学技术学院 上海 200433 |
引用文本:
马超,韦刚,裴颂文,吴百锋.GPU上稀疏矩阵与矢量乘积运算的一种改进.计算机系统应用,2010,19(5):116-120
MA Chao,WEI Gang,PEI Song-Wen,WU Bai-Feng.Improvement of Sparse Matrix-Vector Multiplication on GPU.COMPUTER SYSTEMS APPLICATIONS,2010,19(5):116-120
马超,韦刚,裴颂文,吴百锋.GPU上稀疏矩阵与矢量乘积运算的一种改进.计算机系统应用,2010,19(5):116-120
MA Chao,WEI Gang,PEI Song-Wen,WU Bai-Feng.Improvement of Sparse Matrix-Vector Multiplication on GPU.COMPUTER SYSTEMS APPLICATIONS,2010,19(5):116-120