基于龙芯3A 的LAPACK 函数优化
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家“核高基”重大专项(2009ZX01028-002-003-005);国家自然科学基金(60833004);高等学校学科创新引智计划(B07033)


Optimization of LAPACK Based on Loongson 3A
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对龙芯3A 体系结构, 通过底层BLAS 库的优化、LAPACK 分块算法中分块大小的改善以及LAPACK函数的单独优化这三种途径来提升LAPACK 函数的性能. 用LAPACK 自带的性能测试程序进行测试, 实验结果表明, 有240 个LAPACK 函数的性能提升达到30%以上, 占全部性能测试函数的81%.

    Abstract:

    According to the characteristics of Loongson 3A architecture, this paper shows three ways to improve the performance of LAPACK: optimization of the underlying BLAS library, the selection of the best block size of the block algorithm in LAPACK and optimization of the specific LAPACK functions. By running the LAPACK Timing Programs, experimental results are obtained and it shows that the performance of 240 LAPACK functions, which account for 81% of all the LAPACK Timing Programs, is increased by more than 30%.

    参考文献
    相似文献
    引证文献
引用本文

张斌,顾乃杰,何颂颂,刘斌斌.基于龙芯3A 的LAPACK 函数优化.计算机系统应用,2012,21(11):63-67

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2012-03-27
  • 最后修改日期:2012-05-18
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号