多核龙芯3A 上二级BLAS 库的优化
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

基金项目:国家高技术研究发展计划(863)(2008AA010902);自然科学基金(60833004)


Optimization of BLAS Level 2 Based on Multi-Core Loongson 3A
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对龙芯3A 体系结构以及二级BLAS 库函数的特点,在指令级、存储级和线程级抽取并行方案,总结了一些合适的优化方法,并对其进行了定量的分析。实验表明,这些优化可以将二级BLAS 函数单线程的性能提升20%以上,多线程下也可以得到2.5 倍左右的加速比,这对今后多核龙芯上的系统软件优化工作有着一定的帮助。

    Abstract:

    According to characteristics of Loongson 3A architecture and BLAS level 2, this article derives the parallel solutions from instruction level, storage level and thread level. We summarize some suitable optimization methods and make a quantitative analysis. Experiment shows that the single-threading performance of BLAS level 2 is increased by 20%, and the multi-threading speedup reaches to 2.5. All of these will give some help to the optimization of system software on multi-core Loongson 3A.

    参考文献
    相似文献
    引证文献
引用本文

李毅,何颂颂,李恺.多核龙芯3A 上二级BLAS 库的优化.计算机系统应用,2011,20(1):163-167

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2010-04-29
  • 最后修改日期:2010-05-27
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号