基于Kokkos框架的CFD求解器性能可移植性分析
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

江苏省高校优势学科建设工程; 国家自然科学基金委员会联合基金 (U20A2070)


Performance Portability Analysis of CFD Solver Based on Kokkos
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    为提高计算流体力学的求解速度, 一般采用并行执行的方法, 然而由于计算硬件架构和编程语言的多样性, 对程序的可移植性带来了挑战. 为此本文使用Kokkos框架实现了计算流体力学求解器的异构并行计算, 并且使用规约法、原子操作和染色法来处理并行计算过程中的数据冲突问题, 提出了基于此框架下的异构并行计算的数据冲突的算法实现方案. 针对图形处理器的架构特点, 分析了不同硬件上单精度和双精度计算的加速比, 得出了不同计算硬件上的最优并行策略. 研究证明使用原子操作单精度计算对于使用图形处理器加速流体力学计算而言, 能够极大地提升求解效率.

    Abstract:

    To accelerate the solution of computational fluid dynamics (CFD), parallel execution is commonly used. However, the diversity of computing hardware architectures and programming languages poses challenges to program portability. In this study, the Kokkos framework is used to implement heterogeneous parallel CFD computing. Moreover, the reduction method, atomic operations, and the coloring approach are employed to address data conflicts in the process of parallel computing. A specific algorithmic solution for data conflict in heterogeneous parallel computing under this framework is proposed. Given the architectural characteristics of the graphics processing unit (GPU), the speedup ratios of single-precision and double-precision calculations on different hardware are analyzed, and optimal parallel strategies on different computing hardware are obtained. The study demonstrates that using atomic operations for single-precision computations on GPUs significantly enhances CFD solving efficiency.

    参考文献
    相似文献
    引证文献
引用本文

王辰,陈龙.基于Kokkos框架的CFD求解器性能可移植性分析.计算机系统应用,,():1-8

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2024-10-07
  • 最后修改日期:2024-10-21
  • 录用日期:
  • 在线发布日期: 2025-02-28
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号