随着互联网市场竞争日趋激烈, 市场逐步细分促使产品的个性化需求不断增加, 众多互联网产品如何在激烈的市场竞争中获得用户青睐, 能够快速适应市场需求变化并能实现高质量持续交付是关键. 为适应不断变化的市场需求, 产品的持续交付需要重复整合需求分析、设计、编码、测试、部署和维护各阶段工作, 大量重复、缺乏协作的工作严重制约团队效率和产品质量提高, DevOps模式下的pipeline流水线可以实现从版本控制库到交付用户过程的自动化[1], 成为互联网产品开发与管理的可行途径.
1 国内外研究现状近年来, DevOps在国内外已有广泛的研究和实践, 并在不同领域、不同行业证实基于DevOps模式的项目研发, 在系统质量控制和缩短客户的交付响应时间上有突出的表现[2-4], 可以显著提升产品持续交付的质量和效率[2,4,5]. 然而, DevOps的实践没有固定模式, 受制于公司的规模、架构和文化, 呈现多样性特征. Roche结合自己在Amazon, Adobe公司大型项目研发经验, 提出了一种多角色协同的DevOps模式, 并研究了该模式下的质量保障体系[6]; Kamuto等研究了大型分布式项目中DevOps实施的各类制约因素[7]; Rajkumar等研究了DevOps文化在基于云环境下的产品交付和开发的影响, 指出DevOps模式需要对组织机构、管理策略等进行较大的改变[8]. 而由于交付的频繁, 能够设计符合企业实际的自动化交付方案, 确保软件处于一个稳定的、可随时发布的状态, 是持续交付实践的关键. Krusche等提出了利于持续交付工作流快速交付产品的模型[9]. Düllmann等提出一种基于DevOps实践的高可靠性的持续交付流水线实现方案[10], Shah等探讨了采用Jenkins、GIT等自动化工具构造持续交付流水线的可能模式[11]. 文献[4,12]调研了国内外众多知名企业DevOps实践, 实践过程中使用的自动化工具进行调查, 其中Jenkins、GIT、Docker被广泛应用[13]. 随着DevOps的日益成熟, 其逐渐成为大型互联网企业首选模式, 而中小规模企业实施持续交付时完全借鉴现有的DevOps模式, 难以落地. 一方面企业规模、管理模式、人员结构存在差异, 完全抛弃企业原有的辅助工具、管理模式成本较大; 另一方面随着发布频率提高, 产品维护和升级操作频繁, 身兼数职的人员难以完成工作.
针对DevOps模式在中小规模企业实践存在的问题, 提出了一种轻量级的持续交付方案, 将软件交付流程进行优化, 通过调查问卷的形式了解区域互联网企业的DevOps应用现状和特点, 以企业实践和组织成员访谈论证了方案的可行性
2 轻量级持续交付方案设计以灵活的自动化形式实现从版本控制库到交付用户的方案, 首先要选取相应的工具, 目前在版本控制、代码扫描、自动化测试、构建和部署等方面的主流使用工具如表1所示.
以开源性、可扩展性和操作简便性为原则, 本文使用GIT[14]作为版本控制工具以Jenkins[13]为持续交付服务, 集成sonar进行增量式代码扫描, 以Maven完成自动编译和打包, 在Robot Framework[15]框架下编写自动化测试用例.
新功能的开发或缺陷问题的修复产生软件版本的迭代, 开发人员将产生迭代的代码提交到版本控制库时便触发一次产品的交付. 这包括将代码集成后交付给测试人员进行人工验证以及在生产环境上线部署交付到用户使用. 由于项目的频繁更新迭代, 将记录交付测试、用户的流水线脚本和测试脚本以版本库的形式实现保证了交付过程能够持续进行[4], 一个完整的轻量级持续交付方案如图1所示.
(1)无论是新功能开发完成还是线上问题修复均需要在测试环境验收通过才能交付用户, 项目交付到测试人员时, 代码编写规范、空指针、内存溢出等规范性和阻塞性问题要尽早发现, 同时保证本次提交不能对以往版本产生影响, 因此项目远程仓库更新后, 持续交付服务自动调用已编写有代码审查、单元测试、打包和回归测试的流水线构建脚本. 执行完成后以邮件的形式通知测试和开发人员, 若执行失败开发人员进行代码修复, 反之成功则将当前版本打包归档, 测试人员开始冒烟测试和系统测试, 测试通过等待上线. 交付到测试的流水线脚本结构如图2所示.
(2)为了实现后续快速上线, 执行交付用户的流水线过程如下:
① 代码获取: 新代码在测试环境验收通过后手动合并到主分支, 通过git clone的命令获取主分支上的代码以便在后续的阶段中部署到生产环境.
② 构建: Maven项目的构建以mvn clean package命令完成编译和打包的过程.
③ 部署: 部署时实行停机更新时是先停止服务的进程, 把项目打包完成后将war包放到指定路径启动服务.
④ 通知上线结果, 应用构建部署成功则通知相关人员并将当前版本的包归档, 若部署失败则相关人员根据构建日志进行问题修复.
交付用户的流水线过程如图3所示.
3 实验 3.1 行业调查
为调查青岛市互联网企业组织现状, 反映DevOps应用特点, 为企业实践提供组织管理依据, 本文通过第三方调查平台发起调查问卷. 问卷设置问题均为客观选择题, 第一部分组织管理问题, 包括: 组织实施模型、团队自动化程度、员工培训投入、团队DevOps经验, 第二部分为IT组织性能调查, 问题包括项目交付周期和部署频率.
问卷中将组织模型分布设置为4类, 主要探讨不同模型在项目交付上的区别. 其中瀑布模型依次进行设计、开发、测试和运维过程, 开发周期长, 项目成果整体交付[16]; 敏捷和瀑布混合模型下交付方式视项目需求而定, 在新功能的引入和缺陷修复中使用敏捷方法[17]; 敏捷模型项目采用敏捷开发方法逐渐迭代[18]; DevOps模型则高度引入自动化测试, 实现持续集成和持续交付.
经过统计共收到72份有效的问卷, 其中仅有9%的企业组织过程能采用到DevOps过程模型, 有24%的企业能够实施敏捷模型, 而67%的互联网企业仍然采用瀑布模型或瀑布模型与敏捷相混合的过程. 组织模型的分布如图4所示.
① 员工培训投入包括: 未对员工进行任何新技术培训; 关注员工业务知识培训; 定期组织技术分享会议. 在统计中85%的DevOps企业定期组织技术分享会议, 占整个调查的30%.
② 自动化程度: 无自动化工具; 仅使用自动化进行问题验证; 有涉及集成和交付的自动化岗位. 在统计中仅27.8%的公司能够设立专职的自动化岗位, DevOps企业均有专职的自动化岗位, 占其中的35%.
③ 团队DevOps经验调查的问题包括: 无相关经验; 仅对DevOps有学习了解; 关键领导岗位有DevOps实践经验. 其中对DevOps有学习了解或经验的占总数的43.05%, 而所有的DevOps应用企业关键领导岗位均有DevOps实践经验.
结论1: DevOps在青岛互联网企业中应用较少. 而企业要成功实施DevOps, 一方面要重视团队技术培训的投入提高组织自动化程度, 另一方面, 一个有较强领导力的团队领导也是DevOps能够成功实施的重要因素.
如图5所示, 在组织模型与交付周期关系的图表中, 瀑布模型或瀑布与敏捷混合的两个过程中分别有30%和7.69%的企业存在项目延期的情况, 分别有40%和61.65%的企业交付周期在3~4周完成交付, 仅有30%和30.77%的企业交付周期能实现2周完成一次交付, 无企业在这两种形式下进行1周完成多次的项目交付, 而敏捷模型和DevOps模型的企业中有12.50%和66.67%的企业能在一周完成多次的交付.
如图6在组织模型与部署频率关系的图表中, 采用瀑布模型的企业70%的部署频率为每月部署一次, 无企业的部署频率在一周部署多次; 瀑布和敏捷混合的组织模型中相比较瀑布模型的部署频率更多的达到每2周部署一次, 仍然无企业实现1周部署多次的情况; 在敏捷模型过程中75%的企业能实现1周部署一次, 无企业部署按月进行, 相比较前2种的频率有所增高, DevOps模型中首次出现1周部署多次的情况, 所占比例为33.33%但大部分即66.67%的部署频率在一周部署一次, 相比较前3者的部署频率最高.
结论2: 随着企业采用的组织模型由瀑布模型向敏捷模型、DevOps模型的过程转变项目交付周期逐渐缩短, 相对应的部署频率也就越高, 这与敏捷模型和DevOps模型提倡项目迭代和持续集成的目标是一致的.
3.2 轻量级持续交付方案企业应用分析自2019年1月, S公司开始在原有敏捷开发的基础上采用轻量级的交付方案, 并在持续交付服务基础上研发了持续交付管理平台, 如图7所示的流水线管理模块, 在新建一条流水线后可灵活选择验证过程和回归测试用例, 对交付流水线进行修改、查看详情、执行流水线以及删除操作. 如图8所示的项目迭代管理是对上线功能的版本管理同时进行发布.
经过一段时间的实践在项目交付能力和交付质量上有较明显提升. 如图9所示, 以交付周期和部署频率体现项目的交付能力, 敏捷方法的交付周期和部署频率在10天左右, 采用轻量级方案后交付周期和部署频率有下降到6天作用, 交付能力得到提高.
项目变更失败比例是指在项目上线时需要进行系统修复的比例, 包括代码回滚、服务重启、缺陷修复等现象, 以项目变更失败比例来衡量项目交付质量. 如图10所示, 采用流水线方案前失败比例在8.5%上下浮动, 而采用方案后交付过程进行标准化操作, 降低了人为操作失误, 同时测试更加充分, 失败比例逐步降至4%左右.
修复问题的过程是开发人员修改完代码后交由测试人员进行验证, 验证通过交由运维部署上线, 如图11所示, 原敏捷过程通过查找代码提交记录和运维记录可粗略统计平均在3.5小时. 而采用流水线形式之后自动化回归验证通过可直接上线, 用时逐步下降到2.5小时.
4 总结
本文在敏捷过程的基础上将项目交付中重复度高的工作利用自动化工具, 使用流水线形式实现, 通过问卷调查明确企业要实施DevOps需要进行的组织管理改进, 对存在角色重叠的互联网企业使用流水线前后的组织性能包括项目交付能力和交付质量进行对比, 为企业实施DevOps, 实现持续交付提供了参考.
本文的不足之处主要体现在两个方面, 一方面在流水线方案中, 一个流水线执行完测试验证需要上线时要进行申请, 经过专人确认后方能上线, 需要申请的原因是当有多个功能需要上线时防止项目代码相互覆盖, 如何有效的解决上线等待问题将是今后的研究方向. 另一方面本文调查问卷仅对青岛市企业进行统计且企业数量相对偏少, 在今后将对不同地区互联网企业的持续关注, 不断完善调查报告.
[1] |
Humble J, Farley D. 持续交付: 发布可靠软件的系统方法. 乔梁, 译. 北京: 人民邮电出版社, 2011.
|
[2] |
Gupta RK, Venkatachalapathy M, Jeberla FK. Challenges in adopting continuous delivery and DevOps in a globally distributed product team: A case study of a healthcare organization. Proceedings of 2019 ACM/IEEE 14th International Conference on Global Software Engineering. Montreal, QC, Canada. 2019. 30–34.
|
[3] |
Punjabi R, Bajaj R. User stories to user reality: A DevOps approach for the cloud. Proceedings of 2016 IEEE International Conference on Recent Trends in Electronics, Information & Communication Technology. Bangalore, India. 2016. 658–662.
|
[4] |
Liu YH, Li CB, Liu W. Integrated solution for timely delivery of customer change requests: A case study of using DevOps approach. International Journal of U- and E-Service, Science and Technology, 2014, 7(2): 41-50. DOI:10.14257/ijunesst.2014.7.2.04 |
[5] |
翟志军. JenKins 2.x实践指南. 北京: 电子工业出版社, 2019.
|
[6] |
Roche J. Adopting DevOps practices in quality assurance. Communication of the ACM, 2013, 56(11): 38-43. DOI:10.1145/2524713.2524721 |
[7] |
Kamuto MB, Langerman JJ. Factors inhibiting the adoption of DevOps in large organisations: South African context. Proceedings of 2017 2nd IEEE International Conference on Recent Trends in Electronics, Information & Communication Technology. Bangalore, India. 2017. 48–51.
|
[8] |
Rajkumar M, Pole AK, Adige VS, et al. DevOps culture and its impact on cloud delivery and software development. Proceedings of 2016 International Conference on Advances in Computing, Communication, & Automation. Dehradun, India. 2016. 1–6.
|
[9] |
Krusche S, Alperowitz L, Bruegge B, et al. Rugby: An agile process model based on continuous delivery. Proceedings of the 1st International Workshop on Rapid Continuous Software Engineering. Hyderabad, India. 2014. 42–50.
|
[10] |
Düllmann TF, Paule C, Van Hoorn A. Exploiting DevOps practices for dependable and secure continuous delivery pipelines. Proceedings of 2018 IEEE/ACM 4th International Workshop on Rapid Continuous Software Engineering. Gothenburg, Sweden. 2018. 27–30.
|
[11] |
Shah J, Dubaria D, Widhalm J. A survey of DevOps tools for networking. Proceedings of 2018 9th IEEE Annual Ubiquitous Computing, Electronics & Mobile Communication Conference. New York, NY, USA. 2018. 185–188.
|
[12] |
金泽锋, 张佑文, 叶文华, 等. 面向完整价值交付的文档DevOps应用研究. 软件学报, 2019, 30(10): 3127-3147. |
[13] |
黄璜, 张贺, 邵栋. 自动化工具对中国DevOps实践的影响. 软件学报, 2019, 30(10): 3056-3070. DOI:10.13328/j.cnki.jos.005788 |
[14] |
Soni M. End to end automation on cloud with build pipeline: The case for DevOps in insurance industry, continuous integration, continuous testing, and continuous delivery. Proceedings of 2015 IEEE International Conference on Cloud Computing in Emerging Markets. Bangalore, India. 2015. 85–89.
|
[15] |
Stresnjak S, Hocenski Z. Usage of robot framework in automation of functional test regression. Proceedings of the 6th International Conference on Software Engineering Advances. Barcelona, Spain. 2011. 30–34.
|
[16] |
邢斌斌, 姚郑. CMM/CMMI与软件生命周期模型关系的研究. 计算机应用研究, 2007, 24(11): 65-69. DOI:10.3969/j.issn.1001-3695.2007.11.019 |
[17] |
闫帅. 中小型企业使用瀑布模型与敏捷开发相结合的产品开发项目管理方法. 计算机光盘软件与应用, 2011(1): 152-153. |
[18] |
容国平, 张贺, 邵栋, 等. 软件过程与管理方法综述. 软件学报, 2019, 30(1): 62-79. DOI:10.13328/j.cnki.jos.005645 |