基于遗传算法的Kubernetes资源调度算法

引用本文

胡程鹏, 薛涛. 基于遗传算法的Kubernetes资源调度算法. 计算机系统应用, 2021, 30(9): 152-160.http://www.c-s-a.org.cn/1003-3254/8062.html

Hu CP, Xue T. Kubernetes Resource Scheduling Algorithm Based on Genetic Algorithm. Computer Systems and Applications, 2021, 30(9): 152-160(in Chinese).http://www.c-s-a.org.cn/1003-3254/8062.html

基于遗传算法的Kubernetes资源调度算法

胡程鹏, 薛涛

西安工程大学计算机科学学院, 西安 710048

收稿日期：2020-11-30; 修改日期：2020-12-28; 采用时间：2021-01-13; csa 在线出版时间：2021-09-02

基金项目：陕西省技术创新引导专项(2020CGXNG-012)

通讯作者：薛涛, E-mail: 2843053453@qq.com.

摘要：Kubernetes在优选阶段仅根据节点CPU和内存的利用率来决定节点的分值, 这只能保证单节点的资源利用率, 无法保证集群资源的负载均衡. 针对该问题, 提出一种基于遗传算法的Kubernetes资源调度算法, 该算法加入了网络带宽和磁盘IO两项评价指标, 同时为评价指标赋予不同权重值, 并且引入校验字典校验并修复遗传算法生成的新种群中不符合配置的个体. 实验结果表明, 与Kubernetes默认资源调度策略相比, 该算法考虑了集群中的所有节点的资源利用率, 在保证集群负载均衡方面有着更好的效果.

关键词: Kubernetes 遗传算法资源调度云平台云计算

Kubernetes Resource Scheduling Algorithm Based on Genetic Algorithm

HU Cheng-Peng, XUE Tao

School of Computer Science, Xi’an Polytechnic University, Xi’an 710048, China

Foundation item: Technology Innovation Guiding Project of Shaanxi Province (2020CGXNG-012)

Abstract: In the optimization stage, Kubernetes determines the score of a node only according to its utilization of CPU and memory. This can only guarantee the resource utilization of a single node but fails to achieve the load balancing of cluster resources. In response to this problem, a genetic algorithm-based Kubernetes resource scheduling algorithm is proposed. In the algorithm, two evaluation indicators, i.e., network bandwidth and disk IO, are added and assigned with different weights. In addition, a check dictionary is introduced to check and repair the individuals that do not meet the configuration in the new population generated by the genetic algorithm. Experimental results show that compared with the Kubernetes default resource scheduling strategy, this algorithm takes into account the resource utilization of all nodes in the cluster and performs better in ensuring cluster load balancing.

Key words: Kubernetes genetic algorithm resource scheduling cloud platform cloud computing

1 引言

随着互联网规模的扩大, 服务器产生的海量数据促使云计算^[1]的快速发展. 云计算是指将大量用网络连接的计算资源进行统一管理和调度, 构成一个计算资源池向用户提供服务. 通过云计算, 可以合并组织现有的公司信息资源, 并为其员工和合作伙伴提供通用的远程访问权限^[2]. 云计算的问题之一是对资源的利用不均. 传统云计算架构中基础设施及服务层(IaaS)的资源分配是以虚拟机为基本单位进行调度, 但是虚拟机的调度是一种粗粒度的资源调度, 会出现调度缓慢等问题.

2013年, 随着Docker^[3]等容器技术的快速发展, 基于容器的虚拟化技术迅速成为各大云计算厂商和云计算开发者的首选. 与虚拟机相比, 容器技术具有镜像小、资源消耗少、应用部署灵活和启动速度快等优点^[4]. 大量的容器依托容器编排工具进行管理和控制, 其决定容器之间如何进行交互. 以Kubernetes^[5]为代表的容器编排工具渐渐成为云原生的事实标准, 越来越多的微服务使用Kubernetes进行部署和管理. Kubernetes自动化部署的功能可以使开发者轻松部署应用, 自动化管理的功能可以让定义好的服务一直按照用户期望的状态运行, 自动扩容\缩容的功能让服务器拥有的副本数量随着用户访问负载的变化而增减成为可能.

Kubernetes的资源调度技术是云计算中的关键技术, 良好的资源调度策略可以使云服务提供商提高其资源利用效率, 节约软硬件成本, 同时也可以让用户得到更优质的云服务体验.目前, 云计算资源调度领域的研究集中在两个方向上^[6]: 一是根据各种指标寻找最佳调度方案, 并根据其周期性对收集的服务器负载统计信息进行分析. 此方法提供对云平台的连续监视和对其工作量的定期评估, 基于此评估可以决定是否需要重新调度; 二是根据服务器负载的周期性, 使用机器学习方法和时间序列分析, 如LSTM^[7], 通过分析收集的重要时期负载数据, 从而确定调度时机. 何龙等^[8]实现了一种基于应用历史记录的Kubernetes调度算法, 该方法实现简单, 对集群资源利用率有一定提高, 但是其只考虑了CPU和内存的资源利用率, 诸如网络和磁盘资源等方面的研究不足. 常旭征等^[9]针对Kubernetes仅考虑了CPU和内存, 加入了磁盘和网络两个指标, 提高了集群资源利用率, 但是并未考虑节点本身的性能指标. Kong等^[10]通过将时间和可靠性作为资源调度的目标, 以模糊规则作为预测模型, 提出了一种基于模糊规则预测的调度算法. 李天宇^[11]提出了一种基于强化学习的云计算虚拟机资源调度问题的解决方案和策略, 采用Q值^[12]强化学习机制实现了虚拟机资源调度策略. 虽然强化学习算法能动态调整自身参数和网络结构, 拥有良好控制策略, 但是模型训练本身需要占用大量资源. Kang^[13]提出了容器代理系统. 该系统使用 k-medoid算法和分段算法来实现容器工作负载感知和节能, 同时还保证了集群的资源利用率和负载均衡能力, 但是此方法未考虑节点的网络和磁盘等资源利用情况. Rao等^[14]提出一种分布式学习机制, 将云资源分配视为一种分布式学习任务, 开发了一种增强学习算法并在iBallon系统中对分布式学习算法进行了原型设计, 但是该方法仅考虑单个虚拟机资源, 忽略了集群的整体资源性能. Tsoumakos等^[15]提出了TIRAMOLA这一支持云的开源框架, 它可以根据用户定义的策略对NoSQL集群进行自动调整大小, 并且这一过程是实时进行的, 但是此框架只对NoSQL集群效果显著.

Kubernetes默认调度机制只考虑了单节点的资源利用率, 未考虑整个集群的负载情况. 因此, 本文针对这一问题提出了一种基于遗传算法的Kubernetes资源调度算法. 在种群初始阶段, 通过随机方式初始化种群, 引入校验字典对种群中的个体进行校验, 同时修复不符合配置要求的个体; 在计算适应度值阶段, 将集群平均负载的标准差作为目标函数值, 标准差越小则表示集群负载越均衡; 使用轮盘赌选择方法选择优良个体进入下一代, 在交叉、变异操作后使用校验字典再次对种群中的个体进行校验和修复.

2 默认调度算法分析

Kubernetes Scheduler是Kubernetes资源调度的核心组件, 其职责是将API Server或Controller Manager新建的待调度Pod根据指定的调度算法与集群中的某个合适的工作节点进行绑定, 并将Pod和节点的绑定信息写入ETCD中^[16]. 而后工作节点通过守护进程Kubelet监听到Kubernetes调度器发出的Pod和节点的绑定信息, 并从ETCD中获取Pod配置文件, 最后根据配置文件完成容器应用的启动.

Kubernetes调度器中的默认调度算法分为3个阶段: 预选阶段(Predicates)、优选阶段(Priority)和选定阶段(Select). Predicates阶段的工作是查询集群中的所有节点, 根据Predicates的算法选择适用的节点完成初筛. Priority阶段的工作是根据Priority中的算法给Predicates阶段初筛的节点进行评分, 挑选出得分最高的节点作为调度的目标节点.

Predciates阶段要求满足条件的节点必须通过所有筛选策略. 下面介绍几种策略的筛选内容:

1) PodFitsHostPorts: 检查Pod请求的端口是否空闲;

2) PodFitsHost: 检查Pod是否通过其主机名指定了特定的Node;

3) PodFitsResources: 检查节点是否有空闲资源(例如CPU和内存)来满足Pod的要求;

4) MatchNodeSelector: 检查Pod的节点选择器是否匹配节点的标签;

5) CheckNodeMemoryPressure: 如果节点正在报告内存压力, 并且没有配置的异常, 则不会再此处分配Pod;

6) CheckNodeCondition: 节点可以报告具有完全完整的文件系统, 网络不可用或者Kubelet尚未准备好运行的Pod. 如果为节点设置了这样的条件, 并且没有配置的异常, 则不会在此处分配Pod.

优选阶段会根据优选策略对每个节点进行打分, 最终把Pod调度到分值最高的节点. Kube-Scheduler用一组优先级函数处理每个通过预选的节点, 每个函数返回0–10的分数, 各个函数有不同权重, 最终得分是所有优先级函数的加权和, 即节点得分的计算公式为:

$ \textit{FinalScoreNode} = \sum\limits_{i = 1}^n {weigh{t_i} * priorityFun{c_i}} $

(1)

式(1)中, $\textit{FinalScoreNode}$ 表示最终得分, $weigh{t_i}$ 表示各个函数的权重值, $priorityFun{c_i}$ 表示具体的优先级函数得分.

在Priority阶段的算法有: Least RequestedPriority、NodeAffinityPriority等. 下面说明这两种算法:

1) Least RequestedPriority算法默认权重为1, 此算法尽量将Pod调度到计算资源占用比较小的节点上. 此算法设计两种计算资源: CPU和内存. 计算公式如下:

$ cpuScore = \frac{{cpuCapacity - \displaystyle\sum {cpuRequest} }}{{cpuCapacity}} * 10 $

(2)

$ memoryScore \!=\! \frac{{memoryCapacity \!-\!\! \displaystyle\sum {memoryRequest} }}{{memoryCapacity}}\! * \!10 $

(3)

$ leastScore = \frac{{cpuScore + memoryScore}}{2} $

(4)

式(2)中, $cpuCapacity$ 表示候选节点CPU资源的总量, $cpuRequest$ 表示Pod需要的CPU资源量, $cpuScore$ 表示根据CPU指标计算的得分. 式(3)中, $memoryCapacity$ 表示候选节点内存资源的总量, $memoryRequest$ 表示Pod需要的内存资源量, $memoryScore$ 表示根据内存指标计算的得分. 式(4)中, $leastScore$ 表示使用Least RequestedPriority算法获得的得分.

2) NodeAffinityPriority默认权重为1, 此算法尽量调度到标签匹配Pod属性要求的节点, 判断行为与预选中的MatchNodeSelector类似. 该算法提供两种选择器: requiredDuringSchedulingIgnoredDuringExec-ution和preferredDuringSchedulingIgnoredDuringExec-ution. 计算公式如下:

$ \textit{nodeAffinityScore} = 10 * \frac{{\displaystyle\sum\limits_{i = 1}^n {weigh{t_i}} }}{{CountWeight}} $

(5)

式(5)中, $weigh{t_i}$ 表示节点满足requiredDuringSchedu-lingIgnoredDuringExecution中所有满足条件的规则的权值, $CountWeight$ 表示preferredDuringSchedulingI-gnoredDuringExecution中所有规则的权值总和. $nodeAffinityScore$ 表示使用NodeAffinityPriority算法获得的得分.

在获取了两种算法对候选节点的评分后, Kubernetes调度器取两种算法的加权平均值作为各个节点的最终评分:

$ \textit{FinalScore} = \textit{leastScore} \times 1 + \textit{nodeAffinityScore} \times 1 $

(6)

通过分析Kubernetes调度器的默认算法可以发现其默认算法对节点的评价指标中只考虑了CPU和内存的使用率, 没有考虑磁盘IO和网络带宽的使用. 并且Kubernetes调度器是一种静态调度策略, 该调度机制虽然简单, 但是缺乏灵活性. 且只能在Pod初次部署时进行资源配置. 同时, 默认调度策略只能保证单节点的服务质量, 未考虑整个集群的负载情况. 从而导致集群资源利用率低.

3 Pod分配模型与遗传算法

Scheduler根据调度策略将Pod部署到不同的节点中, Pod在节点之间的分配模型如图1所示, 其可以说明Pod与节点之间的相互关系.

图 1 Pod在Node的分配模型

假设N是系统中所有节点的集合, 即N={Node₁, Node₂, Node₃,…, Node_n}, n表示节点总数, 单一节点表示为 $N{{od}}{{{e}}_i}$ , i表示节点编号, i∈[1, n]. 假设P是系统中所有Pod的集合, 即P={Pod₁, Pod₂, Pod₃,…, Pod_m}, m表示Pod总数, 单一Pod表示为Pod_j, j表示Pod编号, j∈[1, m]. 假设在某个节点 $N{\rm{od}}{{\rm{e}}_i}$ 上有一组Pod, 使用C表示节点中Pod的分配情况, C_i={Pod₁, Pod₂, Pod₃, …, Pod_k}, k表示 $N{\rm{od}}{{\rm{e}}_i}$ 上Pod的数量. 因此图1中的分配情况表示为:C₁={Pod₁, Pod₄}, C₂={Pod₃, Pod₅}, C₃={Pod₂, Pod₆}.

以上模型描述了Pod在节点上的分配结果, 默认资源调度模型尽力将待调度Pod分配在性能最好的节点上运行, 这会导致集群节点的负载不均衡, 集群整体服务质量下降. 通过分析Pod与节点之间的分配关系, 若将m个Pod分配到n个节点中, 根据排列组合可得出共有 ${n^m}$ 种情况^[17], 这是一个NP Hard问题, 在解决这类问题上, 如果问题的固有知识不能被用来减少搜索空间, 很容易产生搜索的组合爆炸.

针对NP Hard问题, 常用启发式算法来解决, 其中遗传算法(GA)^[18]是由Holland教授于1975年提出的一种模拟生物进化的全局搜索算法. 遗传算法具有智能、并行、自组织、可扩展和易于使用的特点. 遗传算法作为一种启发式智能优化搜索算法, 经常用来解决多目标优化的群体搜索问题.

4 改进的遗传算法

针对目前Kubernetes调度算法只考虑单节点资源利用率, 并未考虑集群整体负载均衡的问题, 本文选择遗传算法作为资源调度算法: 在计算适应值阶段, 通过引入磁盘IO、网络带宽评价指标, 并赋予指标权重值, 使用标准差衡量集群的负载均衡情况. 在Kubernetes的yaml配置文件中可以配置Pod运行的最低要求, 如内存至少为4 GB, 最大为16 GB; 磁盘空间至少为1 TB, 最大为2 TB等. 同时, Pod拥有NodeAffinity和Taint两种属性. 在标准遗传算法种群初始化阶段、选择阶段、交叉阶段和变异阶段会产生不符合配置文件的个体, 如将一个最低内存配置为8 GB的Pod分配给了内存为4 GB的节点. 对这些个体进行适应度计算和下一阶段操作都是无意义的, 所以针对此问题对标准遗传算法进行了改进: 在初始种群生成阶段、选择阶段、交叉阶段和变异阶段, 通过引入校验字典对不符合配置的个体进行校验和修复.

4.1 种群初始化 4.1.1 编码的确定

编码是应用遗传算法时要解决的首要问题, 也是设计遗传算法时的一个关键步骤. 针对一个具体应用问题, 设计一种完美的编码方案一直是遗传算法的应用难点之一, 也是遗传算法的一个重要研究方向. 由于遗传算法应用的广泛性, 迄今为止人们已经提出了许多种不同的编码方法, 可以分为3大类: 二进制编码方法、符号编码方法和浮点数编码方法^[19].

根据Pod在节点上的分配模型即可得出这是一种01背包问题, 1表示Pod分配在此节点上, 反之不分配. 并且, 二进制编码方法是遗传算法中最重要的一种编码方法, 它使用的编码符号集是由二进制符号0和1所组成的二值符号集{0,1}, 它所构成的个体基因型是一个二进制编码符号. 因此本文选用二进制编码作为编码方案.

4.1.2 校验字典

确定编码后随机产生N个初始串结构数据, 每个串结构数据成为一个个体, N个个体构成了一个种群. 遗传算法以这N个串结构作为初始点开始迭代. 设置进化代数计数器; 设置最大进化代数T; 随机生成M个个体作为初始群体P(0).

本文的染色体(Chromosome)编码采用二进制编码方法, 每个个体的基因编码是一个二进制编码符号, 即0和1, 采用二维数组存储个体染色体, 行代表Pod, 列代表Node.Chromosome[i][j]=1, 表示要在编号为j的节点上分配第i个Pod. 例如i=1, j=3表示第1个Pod被分配在第3个节点上. 如果生成了以下染色体{100,001,010}, 通过解码可以知道第1个Pod在Node₁上, 第2个Pod在Node₂上, 第3个Pod在Node₃上. 如表1所示为在一次随机初始化种群中产生的一个染色体编码.

表 1 随机初始化个体

表1表示随机初始化种群中的一个个体, 编码为: {100, 010, 001, 100, 010, 100, 100}.

解决Kubernetes资源调度问题的目的是找到合理的资源分配方案, 但是由于Kubernetes的Pod中拥有NodeAffinity (亲和性)和Taint (污点)两种属性, 使得种群中的个体很可能不符合配置:

1) NodeAffinity属性从1.4版本开始引入. 如果在具有标签X的Node上运行了一个或者多个符合条件Y的Pod, 那么Pod应该运行在这个节点上.

2) Taint属性让Pod避开那些不合适的节点, 在节点上设置一个或者多个Taint之后, 除非Pod明确声明能够容忍这些污点, 否则无法在这些节点上.

为解决在随机初始化种群和后续选择操作、交叉操作和变异操作中产生不符合用户配置的个体这一问题, 根据配置文件生成校验字典对生成的个体进行校验操作. 如表2表示为一个校验字典.

表 2 校验字典

表2中, Type为Affine表示Pod倾向于运行在此节点上, Type为Forbid表示Pod禁止运行在此节点上. 通过此校验字典对上文随机生成的个体编码进行校验并修复后所得编码为: {100, 010, 001, 010, 011, 100, 100}.

4.2 多维度加权评价指标

在Kubernetes默认调度算法的优选阶段, 只考虑了节点的CPU和内存利用率, 但是对于互联网应用, 磁盘IO和网络利用率也是十分重要的因素. 因此本文在原有评价指标上加入了磁盘IO和网络利用率指标.

对于某一节点, 其单项资源利用率为该节点上所有Pod对应该项资源分配综合除以节点该项资源值. 例如使用式(7)表示某一节点上CPU的资源利用率L(Cpu_i):

$ L(Cp{u_i}) = \frac{{\displaystyle\sum\limits_{j = 1}^N {CpuPo{d_{ij}}} }}{{PodNu{m_i}}} \times 100{\text{%}} $

(7)

式(7)中, $CpuPo{d_{ij}}$ 表示编号为i的Node节点上编号为j的Pod的CPU使用量, $\displaystyle\sum\nolimits_{j = 1}^N {CpuPo{d_{ij}}} $ 表示编号为i的Node节点上CPU使用总量, $PodNu{m_i}$ 表示 $N{\rm{od}}{{\rm{e}}_i}$ 上Pod的总数. 同理可求得该Node上内存、磁盘IO和网络的利用率 $L(Me{m_i})$ 、 $L(Dis{k_i})$ 、 $L(Ne{t_i})$ . 进而可求得该Node上的资源平均利用率:

$ L({N_i}) = \frac{{L(Cp{u_i}) + L(Me{m_i}) + L(Dis{k_i}) + L(Ne{t_i})}}{4} $

(8)

在实际应用部署中, 不同节点对资源的倾向性不同, 如计算型节点更倾向于CPU的使用, 磁盘类型为SSD的节点更倾向于磁盘IO的使用等. 针对不同类型的节点对评价指标的侧重点不同, 引入权重weight决定各评价指标对节点负载的影响.

$ L({N_i}) = \frac{{Weight(Cp{u_i})\times L(Cp{u_i}) + Weight(M{{e}}{{{m}}_i})\times L(Me{m_i}) + Weight(Dis{k_i})\times L(Dis{k_i}) + Weight(Ne{t_i})*L(Ne{t_i})}}{{Count(Weight)}} $

(9)

式(9)中, Weight(Cpu_i)、Weight(Mem_i)、Weight(Disk_i)、Weight(Net_i)分别表示赋予CPU、内存、磁盘、网络的权重值. 不同于式(9)中分母为4, 使用Count(Weight)根据weight决定分母的值, 若weight为0则不考虑此指标.

4.3 种群初始化

在遗传算法中使用适应度(fitness)来度量群体中各个个体在优化计算中能达到或接近于或有助于找到最优解的优良程度. 适应度函数(fitness function)也称为评价函数, 是根据目标函数确定的用于区分群体中个体好坏的标准, 是算法演化的驱动力, 也是进行自然选择的唯一依据. 适应度较高的个体遗传到下一代的概率较大; 而适应度较低的个体遗传到下一代的概率较小^[20].

在概率论中常用方差来度量随机变量和均值之间的偏离程度, 它刻画了一个随机变量值的分布范围. 方差越大, 表示数据的波动越大, 方差越小, 表示数据的波动就越小. 为了使Kubernetes集群负载均衡, 因此将可行解的平均资源利用率标准差作为适应度的判定条件.

首先, 计算每一种分配方案的资源平均利用率L(Clu_k), 式(10)中N表示符合要求的可行解数量:

$ L(Cl{u_k}) = \frac{{\displaystyle\sum\limits_{i = 1}^N {L({N_i})} }}{N} $

(10)

其次, 通过每一Node上的资源评价利用率L(N_i)和每一种分配方案的资源平均利用率L(Clu_k)可以很方便的计算出每一种分配方案的标准差:

$ \sigma (Cl{u_k}) = \sqrt {\frac{{\displaystyle\sum\nolimits_{i = 1}^N {{{(L({N_i}) - L(Cl{u_k}))}^2}} }}{N}} $

(11)

在遗传算法中, 各个个体被遗传到下一代的种群中的概率是由该个体的适应度来确定的. 适应度越高的个体遗传到下一代的概率就越大. 为了使得集群负载均衡, 标准差越小越好, 所以我们无法直接使用标准差作为适应度值, 通常对于求解最小值的问题我们需要进行转换操作, 因此适应度函数如下所示:

$ Fit(\sigma (Cl{u_k})) \!=\! \left\{\!\!\!\!\! {\begin{array}{*{20}{l}} {Cons{t_{\max}} - \sigma (Cl{u_k})},&{Cons{t_{\max}} > \sigma (Cl{u_k})}\\ 0,&{{\text{其他}}} \end{array}} \right. $

(12)

式(12)中, Const_max为一个适当的相对较大的值, 可以是标准差的最大估计.

5 实验结果与分析

为验证改进算法在Kubernetes集群上的有效性, 本文分别设计3组实验, 实验采用Kubernetes1.17版本, 通过虚拟机的方式部署在宿主机上. 宿主机配置为64位Windows10系统, CPU为i7-8750H, 内存为32 GB.

实验1. 验证引入校验字典的改进遗传算法有更少的迭代次数. 实验结果如图2所示. 标准遗传算法从第190代开始目标函数值趋于最小值, 使用校验字典的改进遗传算法在第110代开始目标函数值趋于最小值. 因此, 与标准遗传算法相比, 改进的遗传算法获得相同的目标函数值所需的迭代次数更少.

图 2 两种算法迭代次数对比

实验2. 对Kubernetes Scheduler默认资源调度器与基于改进遗传算法的自定义调度器(custom scheduler)在保证集群整体负载均衡能力上进行对比. 实验结果如图3所示. 由图可知, 使用Kubernetes默认调度器的集群负载比使用改进遗传算法自定义调度器的集群的平均负载更高, 前者标准差为3.42193, 后者标准差为1.10272, 说明本文算法更能保证集群的负载均衡.

图 3 集群节点负载

实验3. 首先验证引入网络和磁盘IO指标对集群带宽和磁盘IO的影响, 权重值都为1. 如图4、图5分别为使用网络指标和使用磁盘指标后K8s集群的网络和磁盘IO负载情况. 由实验结果可知, 使用K8s默认资源调度算法的网络带宽利用率标准差为0.30489, 磁盘利用率标准差为0.26325. 使用本文算法的网络带宽利用率标准差为0.1387, 磁盘利用率标准差为0.17434. 本文算法的两个指标对应的标准差都比K8s默认调度算法小, 说明本文算法在保证带宽和磁盘负载均衡方面优于K8s默认资源调度算法.

图 4 网络使用率

其次, 为验证权重对不同类型节点的影响, 针对CPU, 内存, 带宽和磁盘分别创建高性能和低性能两种类型节点进行分组实验, 每组实验3个节点, 其中Node₁为高性能节点, Node₂和Node₃为低性能节点.各节点对应资源权重值分别设置为: 0.5, 1, 1.

如图6~图9所示为3个节点在120 s时间内对应资源的使用率情况.

图 5 磁盘使用率

图 6 CPU权重实验

统计3个节点在120 s内对应资源的使用率, 对比Kubernetes默认资源调度算法和本文算法在不同性能节点上资源使用率均值, 将数据归纳如表3所示.

由表3可知, 使用本文算法后高性能节点将承受更高的负载, 如高性能内存节点Node₁使用K8s调度算法使用率为70.08%, 使用本文算法后使用率为78.51%, 这是因为赋予高性能节点更低的权重值降低节点负载从而将更多的Pod调度至此节点. 但是低性能内存节点Node₂使用K8s调度算法使用率为39.61%, 使用本文算法后使用率为35.32%, 说明本文算法降低了低性能节点负载. 虽然高性能节点负载提高了, 但是由于节点的性能优势并不会给节点带来严重负担.所以, 与K8s默认资源调度算法相比, 本文算法结合节点优势特性提高了集群负载能力.

图 7 内存权重实验

6 结语

本文为了优化Kubernetes集群平台中受资源调度影响的负载均衡, 降低集群的平均负载, 提出了基于改进遗传算法的Kubernetes资源调度算法, 该算法根据Kubernetes中Pod拥有的NodeAffinity和Taint属性, 为降低在随机初始化种群、选择操作、交叉操作和变异操作过程中会产生不符合用户配置的个体对结果的影响, 引入校验字典对种群中的个体进行校验及修复, 实验表明校验字典的引入可以减少算法的迭代次数, 提高算法运行效率. 同时, Kubernetes Scheduler默认资源调度算法只考虑了Node的CPU和内存利用率, 结合节点特性提出了多维度加权评价指标, 并使用标准差作为适应度函数, 降低了集群的平均负载且维持了集群的负载均衡. 但与默认资源调度算法相比本文算法对CPU的占用过高, 进而影响Master节点中其他Kubernetes组件的运行, 因此下一阶段工作任务将针对此问题进行研究.

图 8 网络权重实验

图 9 磁盘权重实验

表 3 不同资源使用两种算法的资源使用率(%)

参考文献

[1]	张建勋, 古志民, 郑超. 云计算研究进展综述. 计算机应用研究, 2010, 27(2): 429-433. DOI:10.3969/j.issn.1001-3695.2010.02.007
[2]	Sotomayor B, Keahey K, Foster I. Overhead matters: A model for virtual resource management. Proceedings of the 1st International Workshop on Virtualization Technology in Distributed Computing. Tampa, FL, USA. 2006. 5.
[3]	Sureshkumar M, Rajesh P. Optimizing the docker container usage based on load scheduling. Proceedings of the 2nd International Conference on Computing and Communications Technologies (ICCCT). Chennai, India. 2017.165–168.
[4]	武志学. 云计算虚拟化技术的发展与趋势. 计算机应用, 2017, 37(4): 915-923. DOI:10.11772/j.issn.1001-9081.2017.04.0915
[5]	Bernstein D. Containers and cloud: From LXC to Docker to Kubernetes. IEEE Cloud Computing, 2014, 1(3): 81-84. DOI:10.1109/MCC.2014.51
[6]	Volkova VN, Chemenkaya LV, Desyatirikova EN, et al. Load balancing in cloud computing. Proceedings of 2018 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering. Moscow and St. Petersburg, Russia. 2018. 387–390.
[7]	Hochreiter S, Schmidhuber J. Long short-term memory. Neural Computation, 1997, 9(8): 1735-1780. DOI:10.1162/neco.1997.9.8.1735
[8]	何龙, 刘晓洁. 一种基于应用历史记录的Kubernetes调度算法. 数据通信, 2019(3): 33-36. DOI:10.3969/j.issn.1002-5057.2019.03.009
[9]	常旭征, 焦文彬. Kubernetes资源调度算法的改进与实现. 计算机系统应用, 2020, 29(7): 256-259. DOI:10.15888/j.cnki.csa.007545
[10]	Kong XZ, Lin C, Jiang YX, et al. Efficient dynamic task scheduling in virtualized data centers with fuzzy prediction. Journal of Network and Computer Applications, 2011, 34(4): 1068-1077. DOI:10.1016/j.jnca.2010.06.001
[11]	李天宇. 基于强化学习的云计算资源调度策略研究. 上海电力学院学报, 2019, 35(4): 399-403.
[12]	Wu B, Feng YP. Policy reuse for learning and planning in partially observable Markov decision processes. Proceedings of the 4th International Conference on Information Science and Control Engineering (ICISCE). Changsha, China. 2017.549–552.
[13]	Kang DK, Choi GB, Kim SH, et al. Workload-aware resource management for energy efficient heterogeneous Docker containers. Proceedings of 2016 IEEE Region 10 Conference (TENCON). Singapore. 2016. 2428–2431.
[14]	Rao J, Bu XP, Xu CZ, et al. A distributed self-learning approach for elastic provisioning of virtualized cloud resources. Proceedings of the IEEE 19th Annual International Symposium on Modelling, Analysis, and Simulation of Computer and Telecommunication Systems. Singapore. 2011. 45–54.
[15]	Tsoumakos D, Konstantinou I, Boumpouka C, et al. Automated, elastic resource provisioning for NoSQL clusters using TIRAMOLA. Proceedings of the 13th IEEE/ACM International Symposium on Cluster, Cloud, and Grid Computing. Delft, the Netherlands. 2013. 34–41.
[16]	Liu D, Sui X, Li L. An energy-efficient virtual machine placement algorithm in cloud data center. Proceedings of the 12th International Conference on Natural Computation, Fuzzy Systems and Knowledge Discovery (ICNC-FSKD). Changsha, China. 2016. 719–723.
[17]	Khodar A, Al-Afare HAF, Alkhayat I. New scheduling approach for virtual machine resources in cloud computing based on genetic algorithm. Proceedings of 2019 International Russian Automation Conference (RusAutoCon). Sochi, Russia. 2019. 1–5.
[18]	葛继科, 邱玉辉, 吴春明, 等. 遗传算法研究综述. 计算机应用研究, 2008, 25(10): 2911-2916. DOI:10.3969/j.issn.1001-3695.2008.10.008
[19]	张国辉, 吴立辉. 求解柔性作业车间调度的GATOC混合方法. 计算机工程与应用, 2015, 51(23): 266-270. DOI:10.3778/j.issn.1002-8331.1502-0171
[20]	贾花萍. 智能算法在数学建模比赛中的应用. 计算机系统应用, 2016, 25(8): 149-154. DOI:10.15888/j.cnki.csa.005272