BpfioToolkit: 基于eBPF技术的I/O行为分析工具
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家重点研发计划(2023YFB3001803); 2022年度河南省重大科技专项(221100210600)


BpfioToolkit: eBPF-based I/O Behavior Analysis Tool
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    大规模并行计算应用程序在执行过程中经常面临I/O性能瓶颈, 严重影响整体计算效率. 然而, 现有的I/O跟踪工具在捕获细粒度I/O行为和多层次分析方面存在开销高、侵入性强等问题. 为解决这一挑战, 本文提出了BpfioToolkit, 一种基于eBPF技术的非侵入式I/O跟踪与分析工具套件. 旨在通过跟踪并行应用程序发出的I/O请求, 记录详细的I/O行为日志, 以支持对复杂并行I/O模式的精准分析. BpfioToolkit可以高效地跟踪I/O堆栈中MPI-IO层、系统调用层及虚拟文件系统层的I/O操作, 准确地记录I/O请求频率、读写大小、文件偏移等关键指标. 通过关联各层次的I/O行为数据, BpfioToolkit提供精确且全面的I/O行为视图. 在多个典型并行应用程序和基准测试程序上的实验评估表明, BpfioToolkit在不同I/O强度场景下均保持极低的系统开销(仅0.54%–1.68%), 同时生成丰富的I/O行为数据. 这些数据帮助识别了诸如低效的I/O访问模式、I/O负载不均衡等I/O性能瓶颈. 验证了BpfioToolkit的实用性. BpfioToolkit为大规模并行计算环境中的I/O性能分析与优化提供了有力的技术支持, 展现出广泛的应用前景.

    Abstract:

    Large-scale parallel computing applications frequently encounter I/O performance bottlenecks during execution, which adversely impact overall computational efficiency. However, existing I/O tracing tools suffer from high overhead and strong intrusiveness when capturing fine-grained I/O behaviors and performing multi-level analyses. To address this challenge, this study proposes BpfioToolkit, a low-overhead, non-intrusive I/O tracing and analysis toolkit based on eBPF technology. BpfioToolkit aims to support precise analysis of complex parallel I/O patterns by tracing I/O requests issued by parallel applications and recording detailed I/O behavior logs. I/O operations at the MPI-IO layer, system call layer, and virtual file system layer within the I/O stack are efficiently traced, with key metrics such as I/O request frequency, read/write sizes, and file offsets accurately recorded. By correlating I/O behavior data across these layers, BpfioToolkit provides a precise and comprehensive view of I/O behaviors. Experimental evaluations on multiple typical parallel applications and benchmark programs demonstrate that BpfioToolkit maintains extremely low system overhead (only 0.54% to 1.68%) across different I/O intensity scenarios while generating rich I/O behavior data. These data facilitate the identification of I/O performance bottlenecks, such as inefficient I/O access patterns and I/O load imbalance, validating the practicality of BpfioToolkit. BpfioToolkit offers robust technical support for I/O performance analysis and optimization in large-scale parallel computing environments and exhibits broad application prospects.

    参考文献
    相似文献
    引证文献
引用本文

霍国栋,孙斌,于灏,解西国,曹武迪. BpfioToolkit: 基于eBPF技术的I/O行为分析工具.计算机系统应用,,33():1-13

复制
相关视频

分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2024-12-03
  • 最后修改日期:2025-01-02
  • 录用日期:
  • 在线发布日期: 2025-05-16
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号