基于序列挖掘的Dockerfile规则自动提取工具
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金(61972197); 江苏省自然科学基金(BK20201292)


Dockerfile Rule Automatic Extraction Tool Based on Sequence Mining
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    Dockerfile定义了一组构建容器镜像的指令, 这些指令指示了容器化的应用程序该如何构建. 最近的研究表明Dockerfile存在相当多的质量问题. 在本文中, 我们提出了一种新的工具DMiner (Dockerfile Miner)来提取高质量Dockerfile中的隐含规则, 这些规则将有助于提升Dockerfile的质量. DMiner主要分为3个模块, 分别负责Dockerfile的采集、过滤, Dockerfile的解析处理以及Dockerfile规则的挖掘提取, DMiner将Dockerfile解析成统一的序列表示并使用序列模式挖掘算法来提取规则. 本工具对现有的Dockerfile数据集进行了扩充, 同时新提取出了9条在其他工作未曾出现的规则, 在真实数据集上的大量实验证明了该工具的有效性和高效性.

    Abstract:

    Dockerfile defines a set of instructions for building container images, which instruct how the containerized applications should be built. Recent studies have shown that there are quite a lot of quality problems in Dockerfile. This study proposes a new tool, namely Dockerfile Miner (DMiner) to extract implicit rules from high-quality Dockerfile, and these rules will help to improve the quality of Dockerfile. DMiner is mainly divided into three modules, which are responsible for the collection and filtering of Dockerfile, parsing of Dockerfile, and mining and extraction of Dockerfile rules. DMiner parses Dockerfile into a unified sequential representation and uses a sequential rule mining algorithm to extract rules. This tool expands the existing Dockerfile dataset and extracts nine new rules that have not appeared in other work. A large number of experiments on real datasets show that the tool is effective and efficient.

    参考文献
    相似文献
    引证文献
引用本文

詹威霖,周宇.基于序列挖掘的Dockerfile规则自动提取工具.计算机系统应用,2023,32(7):293-298

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-12-22
  • 最后修改日期:2023-02-23
  • 录用日期:
  • 在线发布日期: 2023-05-22
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号