近年来, 随着日益增长的计算、存储和网络需求, 云计算数据中心能源消耗问题得到了越来越多的关注. 据统计, 2014年美国的数据中心消耗了700亿千瓦时的电力, 相当于该国全年能源消耗总量的1.8%. 高能耗不仅造成高运营成本, 而且会导致巨大的碳排放, 每年信息和通信技术(Information and Communication Technologies, ICT)产业对全球温室气体排放总量的贡献率为2%左右[1]. 实际上, 数据中心的能耗成本与服务器数目以及资源利用状况密切相关, 高能耗问题的主要原因是主机的资源利用率不均衡. 因此, 为了解决数据中心高能耗问题, 研究人员利用虚拟机迁移技术实现数据中心各主机之间动态负载均衡, 达到各主机的资源充分利用[2]. 虚拟机迁移技术即当数据中心物理主机的负载值不在合理范围时, 需要将分配在该主机上虚拟机迁移到合适的主机上, 通过该方法能够实现数据中心物理主机的动态负载均衡, 使数据中心的资源可以合理利用, 从而达到节能降耗的目的[3]. 但是, 数据中心虚拟机迁移过程中, 虚拟机迁移粒度较大, 迁移时传输的数据量也大, 因此, 迁移开销是不可忽略的. 而数据中心负载量不断动态变化的特殊环境会造成虚拟机因负载瞬时峰值而频繁迁移, 这将会产生一部分因虚拟机迁移而引发的能量损耗. 因此, 有必要对虚拟机迁移时机进行研究, 避免物理主机瞬时过载而导致虚拟机频繁迁移, 以提高虚拟机迁移效率, 在保证能耗降低的同时, 尽量使得虚拟机的迁移次数达到最小.
当前, 虚拟机迁移技术在云数据中心高能耗问题上的应用不断改进与发展. 文献[4]采用基于阈值的方法来触发虚拟机迁移, 如果监测到物理主机的负载值高于阈值, 则进行虚拟机迁移, 否则, 不需要虚拟机迁移. 文献[5]提出一种基于时间序列的预测方法, 通过分析当前时间云资源负载值与下一时间预测值之间的变化关系, 实现对云资源负载的动态调整, 该方法通过资源调整来提高物理主机利用率. 文献[6]提出基于负载预测的动态虚拟机整合算法, 通过预测物理主机的负载值来判断物理主机是否处于过载或低载状态, 进而触发虚拟机的迁移. 文献[7]在CloudSim工具中根据历史数据, 使用局部加权回归(the Local Regression, LR)法来预测未来时刻物理主机的资源负载状态. 文献[8]通过布朗指数平滑法预测下一时刻物理主机的负载值, 进而判断物理主机的负载状态, 在一定程度上降低了数据中心能耗, 但该方法所采用的平滑系数固定, 难以适应数据中心负载不断动态变化的情况, 可能造成预测精度不高, 导致虚拟机无效迁移.
综上所述, 关于云计算服务器虚拟机迁移策略的研究大多使用基于阈值或基于预测的方法, 存在以下普遍缺陷: 简单基于阈值的方法不具有灵活性; 简单基于预测的方法需要时刻进行负载值的监测和预测, 造成不必要的工作负载; 由于数据中心瞬时的负载峰值, 单一策略可能造成不必要的虚拟机迁移. 文献[8]采用的指数平滑预测方法是一种时间序列预测法, 但其使用单一的平滑系数, 难以适应数据中心这样负载不断变化的特殊环境. 因此, 本文提出一种基于改进指数平滑预测的虚拟机自适应迁移策略DyESP (Dynamic Exponential Smoothing Prediction), 该策略将阈值和预测相结合, 通过连续判断物理主机负载状态来触发预测机制, 使预测算法采用动态平滑系数, 提高了预测精度, 避免了因瞬时过载而导致的虚拟机无效迁移, 从而提高了虚拟机迁移效率并降低能耗.
1 虚拟机自适应迁移策略 1.1 相关定义虚拟机迁移过程一般分为三部分, 即虚拟机何时迁移, 选择合适的虚拟机迁移以及选择合适的目的主机完成迁移, 其中虚拟机何时迁移是完成迁移过程的第一步也是最关键的一步, 合理的虚拟机迁移触发方法能提高虚拟机的迁移效率, 降低数据中心的能耗. 在对虚拟机迁移触发方法进行描述之前, 需要对虚拟机迁移过程的相关影响因素做如下定义:
定义1. 将数据中心物理主机所构成的有限集合定义为
定义2. 虚拟机迁移过程中, 当物理主机符合迁出条件时, 该物理主机称作源主机, 将所有源主机构成的有限集合定义为D; 当物理主机符合迁入条件时, 该物理主机称作目的主机, 将所有目的主机构成的有限集合定义为O; 当物理主机既不符合迁出条件, 也不符合迁入条件时, 该物理主机称为安全主机, 将所有安全主机构成的有限集合定义为S, 因此,
依据上述定义, 本文提出基于指数平滑预测的自适应虚拟机迁移策略, 该方法通过连续监测判断和自适应预测两部分来提高虚拟机迁移时机的准确性. 由于物理主机的负载值过高或过低都会造成数据中心能量损耗, 并影响服务质量, 因此将监测值划分为过载, 低载和安全值三种状态. 过载表示为物理主机的负载值超过高阈值, 此时需要依据历史数据预测下一段时间的物理主机负载值; 低载表示为物理主机的负载值低于低阈值, 此时需要完成虚拟机的全部迁出并且关闭物理主机; 安全值表示为物理主机的负载值处于高阈值和低阈值之间, 此时不需要进行虚拟机迁移. 本文选择CPU利用率作为迁移触发的主要影响因素, 通过该方法能够在一定程度上避免因瞬时峰值造成的虚拟机不必要迁移, 提高虚拟机迁移效率.
(1) 监测. 为了使虚拟机迁移触发方法更适应数据中心负载不断变化的特殊环境, 降低虚拟机无效迁移次数, 本文通过连续监测4次物理主机的负载值来判断其是否为待迁物理主机, 若其连续监测值高于高阈值且呈上升趋势, 则将该物理主机看作待迁移物理主机. 文献[4]研究表明, 当阈值过高时, 由于数据中心物理主机持续高负载会产生大量能耗; 当阈值过低时, 会造成虚拟机的频繁迁移, 同样会产生由于频繁迁移而带来的大量能耗, 所以选取0.8为阈值. 因此, 本文同样将0.8作为迁移触发阈值.
(2) 自适应预测机制. 由于数据中心物理主机的负载值是动态变化的, 连续监测物理主机的负载值超过阈值且呈上升趋势, 并不代表下一时刻其负载值一定超过阈值, 因此, 本文采用连续10次物理主机的历史负载值, 通过改进指数平滑预测法对待迁移物理主机的下一时刻负载值进行自适应预测. 当预测值超过阈值时, 将该物理主机看作需要进行迁移的物理主机, 否则继续进行监测.
该虚拟机迁移策略能判断物理主机负载值的变化趋势, 并自适应的预测物理主机下一时刻负载值, 提高了预测精度, 有效的避免了因主机负载的瞬时过载而导致虚拟机无效迁移, 从而提高了虚拟机迁移的准确性, 减少了虚拟机无效迁移次数, 进而降低了数据中心能耗. 该方法的流程图如图1所示.
2 自适应预测机制 2.1 指数平滑预测法
二指数平滑法ESP(Exponential Smoothing Prediction)是基于移动加权平均法来预测时间序列变化趋势的方法, 该方法为最近的观测数据赋予较大的权值, 给距离较远的观测值赋予较小的权值, 以此预测下一时刻的值, 适用于中短期趋势预测[10]. 设迁移触发过程中需要s个时间段, 其序列定义为
$Y_t = \left( {\left\langle {t_1,y_1} \right\rangle ,\left\langle {t_2,y_2} \right\rangle ,\left\langle {t_3,y_3} \right\rangle , \cdots ,\left\langle {t_s,y_s} \right\rangle } \right)$ | (1) |
一次指数平滑法的定义为:
$S_t^{\left( 1 \right)} = \alpha {y_t} + \left( {1 - \alpha } \right)S_{t - 1}^{\left( 1 \right)}$ | (2) |
其中,
一次指数平滑法虽然可以较好的预测趋势变化明显的情况, 但具有较大的滞后性, 因此, 本文采用二次指数平滑预测法, 其定义为:
$S_t^{\left( 2 \right)} = \alpha S_t^{\left( 1 \right)} + \left( {1 - \alpha } \right)S_{t - 1}^{\left( 2 \right)}$ | (3) |
二次指数平滑预测法需建立线性趋势预测模型, 其模型为:
${{\mathop {y}\limits^{\frown}}_{t + 1}} = {\alpha _t} + {b_t}T$ | (4) |
${\alpha _t} = 2S_t^{\left( 1 \right)} - S_t^{\left( 2 \right)}$ | (5) |
${b_t} = \frac{\partial }{{1 - \partial }}\left( {S_t^{\left( 1 \right)} - S_t^{\left( 2 \right)}} \right)$ | (6) |
其中, t表示当前时间; T表示当前时间t到未来时间t+T之间的时间段;
在实际的操作中, 需要连续检测s次负载值, 如果都超过阈值, 并且负载值呈现上升趋势, 则进行预测, 利用二次指数平滑预测法计算出截距αt和斜率bt, 并利用式(7)进行预测, 得到时间T的负载值.
${{\mathop {y}\limits^{\frown}} _{s + T}} = {\alpha _s} + {b_s}T$ | (7) |
二次指数平滑法能较好的预测负载的变化趋势, 对数据中心负载值的变化做出合理的判断, 如果预测值在合理的负载范围内, 则不需要进行虚拟机迁移, 否则, 需要进行虚拟机迁移.
2.2 自适应预测机制指数平滑法预测的过程中, 平滑系数表示数据的变化趋势. ESP方法中, 平滑系数一经确定便是一个常数, 难以跟踪数据变化, 导致降低了预测过程的适应性. 针对云数据中心负载不断动态变化的特点, 如果仅采用一个平滑系数, 难以适应整体的变化过程, 所以本文采用动态平滑系数对传统模型进行修正[11].
采用动态平滑系数是指在预测的过程中能够使平滑系数自适应数据中心的特殊环境, 随实际数据的变化而变化. 在传统指数平滑预测模型中, 平滑系数的选择决定了预测精度的高低, 当检测的数据呈水平趋势时, 平滑系数应该选取0.1–0.3, 当检测的数据呈持续上升或下降趋势时, 平滑系数则应该选取0.3–0.5, 当波动较大时, 应选取0.6–0.8[8], 因此, 当数据的变化趋势发生改变时, 单一的平滑系数很难适应预测需求. 为了使预测方法能够更好的适应数据中心不断动态变化的特殊情况, 本文的自适应预测机制采用动态平滑系数, 即在负载值预测的过程中, 平滑系数随着数据的变化而自动调整, 能够很好的适应数据变化的真实情况, 得到更精确的的预测结果. 自适应预测机制的具体过程为:
(1) 确定实际数据. 将连续检测到的T期物理主机历史负载值作为预测机制的初始数据. 本文中使用10期历史数据作为实际数据.
(2) 查找最优的平滑系数. 通过迭代法查找最优的平滑系数, 选取步长为0.0001对平滑系数进行迭代, 而后利用二次指数平滑预测法求出T期数据的误差平方和, 依据误差平方和最小原则获得最优的平滑系数σ, 即:
$e = \min_k \sum\limits_{T= 1}^{10} {{{\left( {x_{Tk}' - {x_{Tk}}} \right)}^2}} $ | (8) |
式中, k表示平滑系数, 取值在0~1范围内以步长0.0001迭代;x'Tk表示当平滑系数为k时第T期数据的预测值; xTk表示平滑系数为k时第T期数据的实际值; 求出不同平滑系数对应的T期数据的误差平方和, 并利用最小原则求出最小的误差平方和, 最小误差平方和对应的平滑系数即为最优的平滑系数.
(3) 预测第T+1期的负载值. 将步骤(2)获得的最优平滑系数带入二次指数平滑预测法中进行预测, 获得T+1期的物理主机负载值.
(4) 迁移触发. 将步骤(3)获得的预测值与阈值进行比较, 当预测值大于阈值时, 说明该物理主机呈现持续过载状态, 需要将该物理主机上合适的虚拟机迁移到适当的目的主机上, 使数据中心的各物理主机达到负载均衡; 当预测值小于阈值时, 说明该物理主机只是处于短暂过载状态, 下一时刻已经不再处于过载状态, 因此, 不需要进行虚拟机迁移.
传统二次指数平滑预测方法中初始值的选择, 当数据量较小时, 选取第一期的实际值作为初始值, 当数据量较大时, 选取前三期的平均值作为初始值. 本文将第一个时间段的实际值做为初始值进行预测.
3 实验与结果分析CloudSim云计算仿真平台[12]是一个可扩展的仿真工具包, 它支持云计算系统和应用程序供应环境的建模和模拟. 为了验证本文提出的动态指数平滑预测方法的有效性, 利用CloudSim3.0版本对该方法进行仿真实验, 并与LR和ESP两种预测方法进行实验对比分析. 其中, 局部线性回归法是对物理节点的历史数据进行线性拟合, 从而得到拟合曲线函数, 进而预测得出物理节点下一时间段的负载值. 本文采用的评价指标是数据中心能耗值和虚拟机迁移次数.
通过CloudSim模拟了云数据中心, 其中包括800台物理主机, 1052个虚拟机. 物理主机由如表1两种型号组成. 为了使该实验具有现实意义, 采用来自COMON项目中监测PlanetLab平台在2011年3月3日这一天的CPU利用率数据作为数据中心物理主机实际负载值, 该数据每5 min采集一次, 在24 h内共采集了288个样本点.
在进行对比实验之前, 为了找出传统二次指数平滑预测方法中预测精度最高的平滑系数, 本文从采集到的物理主机实际负载值中选取连续10期负载值作为实际值, 分别使用平滑系数值为0.4、0.5、0.6、0.7和0.8进行预测分析, 并计算得到相应的标准方差值, 如图2所示, 可以看出, 当平滑系数的取值是0.6时, 所获得的标准方差值较小, 即预测精度较高. 因此, 采用平滑系数为0.6的ESP方法与本文的DyESP方法进行实验对比分析.
如图3所示, 展现了当实际数据取不同期数时, 使用平滑系数为0.6的ESP方法得到的各期误差和与使用本文的自适应预测机制得到的各期误差和的对比结果. 由图可知, 使用自适应预测机制所得出的误差和比使用ESP方法所得出的误差和小, 说明使用自适应预测机制精度更高. 由图得知, 当期数大于10期时, 误差和趋于稳定, 说明各期数据的误差相对于低于10期时更小, 精度更高. 因此, 本文采用10期的历史负载值作为预测的实际值.
如图4所示, 展现了使用平滑系数为0.6的ESP方法得到的下一时刻预测值与实际值的误差以及使用本文的自适应预测机制得到下一时刻负载值与预测值的误差对比. 该实验采用连续10期物理主机历史负载值作为初始数据, 分别使用ESP方法和DyESP方法对其进行预测, 将预测值与实际第11期数据进行比较, 获得误差值. 图4由图可知, 使用自适应预测机制得到的误差比使用二次指数平滑预测法得到的误差小, 即预测的精度相对较高.
如表2所示, 是分别使用LR方法、ESP方法和本文提出的DyESP方法获得的数据中心能耗值以及虚拟机迁移次数的实验结果对比. 结果表明, 与LR和ESP相比, 本文的DyESP方法在数据中心能耗方面分别降低约为34.26%、7.34%; 虚拟机迁移次数方面分别降低约为80.99%、58.55%.
图5是数据中心能耗值随时间变化的趋势. 该对比实验分别对一天内第4 h、8 h、12 h、16 h和20 h的能耗值进行数据检测记录, 从图中能够看出, 相比LR和ESP方法, 本文提出的DyESP方法在4 h和8 h时监测到的数据中心能耗没有明显的降低, 因为, 此刻数据中心物理主机刚开始工作, 处理任务时间较短, 任务量较少, 所产生的能耗没有较大差距, 但随着时间的延长, 物理主机处理的任务越来越多, 各个物理主机的资源利用率越来越大, 数据中心所产生的能耗量也越来越大, 此时, 采用不同预测算法所获得的能耗值差距也在不断增大, 由图3可以看出, 本文的DyESP方法在降低能耗方面有较明显的优势.
图6是虚拟机的迁移次数随时间变化的趋势. 该对比实验同样对一天内第4 h、8 h、12 h、16 h和20 h的能耗值进行数据检测记录, 相比LR和ESP方法, 本文提出的DyESP方法在4 h时检测到虚拟机迁移次数下降趋势不明显, 主要原因是数据中心物理主机一开始处理的任务量较少, 资源占用率低, 物理主机出现过载状态较少, 因此, 需要进行虚拟机迁移的情况较少. 但随着时间推移, 数据中心中各物理主机需要处理的任务量逐渐增加, 物理主机的资源利用率开始不断增加, 使得物理主机出现过载状态的情况越来越多因此, 虚拟机迁移次数开始不断增加, 由图6可以看出, 采用不同预测算法所得到的虚拟机迁移次数的差距在不断增大, 由图可知, 本文的DyESP方法在降低虚拟机迁移次数方面有明显的优势.
图7是数据中心在2011年3月3日这一天的平均违例率. 违例率的大小展示了数据中心服务质量的好坏, 违例率越小, 说明服务质量越好; 反之, 服务质量越差. 由图可知, DyESP方法相较于LR方法违例率有所提高, 而与ESP方法相比, 违例率有所下降. 说明, 本文提出的自适应策略所提供的服务质量比ESP方法高, 但没有LR方法提供的服务质量高. 结合图5和图6的结果可知, 本文提出的方法在降低能耗和降低虚拟机迁移次数方面都有较明显的优势, 而在服务质量方面的优势不足, 这需要进一步的研究.
4 结论
本文提出一种基于指数平滑预测的虚拟机自适应迁移策略, 通过判断s期主机负载值是否连续超过阈值并呈上升趋势来触发预测, 然后根据连续n期历史数据自适应选择平滑系数预测下一时刻的负载值, 从而触发虚拟机迁移, 该方法将双阈值和预测相结合, 在一定程度上提高了预测精度, 避免了因瞬时峰值而导致的虚拟机无效迁移. 经实验表明, 本文提出的DyESP方法在提高预测精度、降低虚拟机迁移次数以及降低数据中心能耗方面有较明显的优势. 下一步的工作是将本文提出的自适应迁移策略进一步改进, 使其在满足数据中心能耗和虚拟机迁移次数都降低的同时, 保证数据中心的服务质量.
[1] |
Ashraf A, Byholm B, Porres I. Distributed virtual machine consolidation: A systematic mapping study. Computer Science Review, 2018, 28: 118-130. DOI:10.1016/j.cosrev.2018.02.003 |
[2] |
Ahmad RW, Gani A, Hamid SHA, et al. Virtual machine migration in cloud data centers: A review, taxonomy, and open research issues. The Journal of Supercomputing, 2015, 71(7): 2473-2515. DOI:10.1007/s11227-015-1400-5 |
[3] |
陈睦, 黄黎明, 李先锋. 云计算中虚拟机磁盘迁移时机优化策略. 计算机工程与设计, 2014, 35(2): 525-530. Chen M, Huang LM, Li XF. Disk migration timing optimization mechanism in cloud computing. Computer Engineering and Design, 2014, 35(2): 525-530. DOI:10.3969/j.issn.1000-7024.2014.02.032 |
[4] |
Zhu XY, Young D, Watson BJ, et al. 1000 Islands: Integrated Capacity and workload management for the next generation data center. Proceedings of 2008 International Conference on Autonomic Computing. Chicago, IL, USA. 2008. 172–181.
|
[5] |
陈强. 基于ARMA模型预测的云计算资源调度策略研究[硕士学位论文]. 重庆: 重庆大学, 2016.
|
[6] |
Zhu JR, Li J, Zhuang Y. Utility-based virtual cloud resource allocation model and algorithm in cloud computing. International Journal of Grid and Distributed Computing, 2015, 8(2): 177-190. DOI:10.14257/ijgdc |
[7] |
Beloglazov A, Buyya R. Optimal online deterministic algorithms and adaptive heuristics for energy and performance efficient dynamic consolidation of virtual machines in Cloud data centers. Concurrency and Computation: Practice and Experience, 2012, 24(13): 1397-1420. DOI:10.1002/cpe.v24.13 |
[8] |
李俊涛, 吴小开. 基于布朗指数法的虚拟机动态整合方法. 计算机工程与应用, 2016, 52(7): 56-61. Li JT, Wu XK. Dynamic consolidation of virtual machines based on Brown's exponential smoothing. Computer Engineering and Applications, 2016, 52(7): 56-61. DOI:10.3778/j.issn.1002-8331.1404-0234 |
[9] |
王斌, 王勤为, 董科, 等. 基于二次指数平滑预测的虚拟机调度方法研究. 计算机应用研究, 2017, 34(3): 723-726. Wang B, Wang QW, Dong K, et al. Research on virtual machine scheduling method based on double exponential smoothing prediction. Application Research of Computers, 2017, 34(3): 723-726. DOI:10.3969/j.issn.1001-3695.2017.03.019 |
[10] |
Papailias F, Thomakos D. EXSSA: SSA-based reconstruction of time series via exponential smoothing of covariance eigenvalues. International Journal of Forecasting, 2017, 33(1): 214-229. DOI:10.1016/j.ijforecast.2016.08.004 |
[11] |
沈海迪, 万振凯. 基于指数平滑法的动态预测机制. 计算机技术与发展, 2017, 27(7): 6-9. Shen HD, Wan ZK. A dynamic prediction mechanism based on exponential smoothing method. Computer Technology and Development, 2017, 27(7): 6-9. DOI:10.3969/j.issn.1673-629X.2017.07.002 |
[12] |
Calheiros RN, Ranjan R, Beloglazov A, et al. CloudSim: A toolkit for modeling and simulation of cloud computing environments and evaluation of resource provisioning algorithms. Software: Practice and Experience, 2011, 41(1): 23-50. DOI:10.1002/spe.v41.1 |