电力系统负荷预测是电网调度管理、发电计划制定的前提条件和关键环节, 精准及快速的负荷预测能够给电网企业带来显著的经济效益, 目前智能电网技术的快速发展需要电力系统具备更快的响应速度和更高的负荷预测效率, 而超短期负荷预测具有耗时短、迭代频率快、准确度高等特性, 因此更加契合未来智能电网系统的发展趋势和要求. 通过超短期负荷预测可以使电力调度人员及时掌握电网负荷的变化趋势情况, 为电力调度人员管理用电计划、实现电力电量平衡调度提供更加科学的指导和依据[1].
目前电力负荷预测的主要研究方向包含点预测[2-5]和区间预测[6-14], 而近年来国家经济的迅速增长使电力系统负荷构成更加复杂[3], 各种不确定因素增多会使点预测负荷模型的复杂度增加、预测精度下降, 而相比于点预测方法, 区间预测方法能够对负荷波动范围进行比较精确的估计, 更有利于负荷调度的评估与决策, 也更加符合未来智能电网发展的需要. 区间预测方法目前已有众多学者研究, 文献[6-9]是基于概率性的区间预测方法, 而概率性区间预测模型对样本完整性要求较高, 需要大量统计数据用于实验, 同时难以验证预测模型是否符合工程实际. 文献[10-14]是基于机器学习的区间预测方法, 常用预测方法有神经网络(Artificial Neural Network, ANN)[10-13]、支持向量机(Support Vector Machine, SVM)[14]等. 基于神经网络的预测模型通常存在模型收敛速度较慢的问题, 很难应用于实时性要求较高的实际工程应用中, 文献[14]提出一种基于SVM的区间预测模型, 但其应用对象为贸易数据, 而贸易数据与负荷数据特征差异较大. 作为SVM的一种改进模型, 最小二乘支持向量机(Least Squares Support Vector Machine, LSSVM)[15]模型具备更低的模型复杂度和更快的求解速度, 将其应用于负荷预测能够极大提升算法运算速度, 其应用成效已有大量论文论证.
针对上述分析, 本文提出一种基于LSSVM模型的超短期负荷区间预测方法, 该方法继承了LSSVM预测模型计算简单且快速的优点, 计算成本较小. 而在基于LSSVM的预测模型中, 另外一个值得注意的问题是模型参数的选择, 由于在实际电网运行过程中统计出的负荷数据通常会含有大量噪声, 针对数据含有大量噪声的特点, 如果能够合理地估计出数据的噪声, 将为此类数据驱动模型的参数优化工作提供良好的依据. Gamma Test[16]作为一种独立于模型的基于数据的噪声估计方法, 可在不知道具体的输入输出的数学模型的情况下估计出样本的最小有效噪声, 文献[17]提出用Gamma Test估计LSSVM参数范围, 然后用于预测, 取得了较好的效果. 综上所述, 本文将使用Gamma Test方法计算的最小有效噪声作为模型参数优化的训练停止准则, 最后通过优化后的参数和估计噪声来计算预测区间.
为验证本文方法的有效性, 以某电网全网负荷数据为对象, 使用所提的区间预测方法进行超短期负荷区间预测, 并与文献[14]方法进行实验比较与分析.
1 基于噪声估计的LSSVM区间预测模型 1.1 LSSVM回归LSSVM回归模型已发展较为成熟, 本文仅做简单介绍, 其模型表示如下:
$y = {w^{\rm{T}}}\varphi ({x}) + b$ | (1) |
式中, x是模型输入, y是输出;
基于LSSVM的回归模为:
$\begin{split} {\rm{min}} \;\; J\{ w,b,e\} =& \frac{1}{2}{w^{\rm{T}}}w + \frac{\gamma }{2}\sum\limits_{i = 1}^N {e_i^2} \\ {\rm{s.t.}}\;{y_i} = &{w^{\rm{T}}}\varphi ({x_i}) + b + {e_i} \\ \end{split} $ | (2) |
式中,
引入拉格朗日乘子, 将式(2)转换为无约束优化问题并求解下列条件:
$\left\{ {\begin{array}{*{20}{l}} {\dfrac{{\partial L}}{{\partial w}} = 0 \to w = \displaystyle\sum\limits_{i = 1}^N {{\alpha _i}\varphi ({x_i})}}\\ \dfrac{{\partial L}}{{\partial b}} = 0 \to - \displaystyle\sum\limits_{i = 1}^N {{\alpha _i}} = 0\\ {\dfrac{{\partial L}}{{\partial {e_i}}} = 0 \to {\alpha _i} = \gamma {e_i},\;\;i = 1,2,\cdots,N} \\ {\dfrac{{\partial L}}{{\partial {\alpha _i}}} = 0 \to {w^{\rm{T}}}\varphi ({x_i}) + b + {e_i} - y = 0,\;\;i = 1,2,\cdots,N} \end{array}} \right.$ | (3) |
最终计算可得:
$\left[ {\begin{array}{*{20}{c}} 0&{{{\vec 1}\;^{\rm{T}}}} \\ {\overrightarrow 1 }&{K + {\gamma ^{ - 1}}I} \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} b \\ \alpha \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0 \\ y \end{array}} \right]$ | (4) |
式中, K是核矩阵,
求解式(4), 可以得到回归模型如下:
$\hat y = \sum\limits_{i = 1}^N {{\alpha _i}k(x,{x_i}) + b} $ | (5) |
在核函数的选择上, 综合考虑计算效率和预测效果, 本文使用高斯径向基函数[18]:
$k({x_i},{x_j}) = \exp \left( {\frac{{ - ||{x_i} - {x_j}|{|^2}}}{\sigma }} \right)$ |
给定数据集
由式(2)~式(4)可得, LSSVM的输入输出模型为:
${y_i} = \sum\limits_{j = 1}^N {{\alpha _j}k\left( {{x_i},{x_j}} \right) + b} + {e_i} = f\left( {{x_i},{w^ * }} \right) + {e_i}$ | (6) |
式中,
由式(5)可知,
${\hat y_0} \approx f\left( {{x_0},{w^ * }} \right) + g_0^{\rm{T}} \cdot \left( {\hat w - {w^ * }} \right)$ | (7) |
式中,
$g_0^{\rm{T}} = \left[ {\frac{{\partial f\left( {{x_0},{w^ * }} \right)}}{{\partial {w_1}}},\frac{{\partial f\left( {{x_0},{w^ * }} \right)}}{{\partial {w_2}}}, \cdot \cdot \cdot ,\frac{{\partial f\left( {{x_0},{w^ * }} \right)}}{{\partial {w_{N{\rm{ + }}1}}}}} \right]$ | (8) |
在LSSVM模型中:
$g_0^{\rm{T}} = \left[ {k({x_i},{x_1}), \cdots ,k({x_i},{x_N}),1} \right]$ | (9) |
根据式(6)和式(7), 系统真实值和一阶泰勒公式估值的误差可表示如下:
$\begin{split} {y_0} - {{\hat y}_0} \approx & {y_0} - f\left( {{x_0},{w^ * }} \right) - g_0^{\rm{T}}\left( {\hat w - {w^ * }} \right) \\ = &{\varepsilon _0} - g_0^{\rm{T}}\left( {\hat w - {w^ * }} \right) \\ \end{split} $ | (10) |
其中,
${\rm{var}} \left( {{y_0} - {\hat y_0}} \right) = {\rm{var}} ({\varepsilon _0}) + {\rm{var}} \left( {g_0^{\rm{T}}\left( {\hat w - {w^ * }} \right)} \right)$ | (11) |
假设误差项服从正态分布
${\rm{var}}\left( {g_0^{\rm{T}}\left( {\hat w - {w^*}} \right)} \right) = \sigma _\varepsilon ^2g_0^{\rm{T}}{\left( {{F^{\rm{T}}}F} \right)^{ - 1}}{g_0}$ | (12) |
其中Jacobian矩阵F有如下的一阶微分形式:
$F = \left[ \begin{gathered} \frac{{\partial f({x_1},\hat w)}}{{\partial {{\hat w}_1}}}{\rm{ }}\frac{{\partial f({x_1},\hat w)}}{{\partial {{\hat w}_2}}}{\rm{ }} \cdots {\rm{ }}\frac{{\partial f({x_1},\hat w)}}{{\partial {{\hat w}_{N{\rm{ + }}1}}}} \\ \frac{{\partial f({x_2},\hat w)}}{{\partial {{\hat w}_1}}}{\rm{ }}\frac{{\partial f({x_2},\hat w)}}{{\partial {{\hat w}_2}}}{\rm{ }} \cdots {\rm{ }}\frac{{\partial f({x_2},\hat w)}}{{\partial {{\hat w}_{N{\rm{ + }}1}}}} \\ \vdots\\ \frac{{\partial f({x_p},\hat w)}}{{\partial {{\hat w}_1}}}{\rm{ }}\frac{{\partial f({x_p},\hat w)}}{{\partial {{\hat w}_2}}}{\rm{ }} \cdots {\rm{ }}\frac{{\partial f({x_p},\hat w)}}{{\partial {{\hat w}_{N{\rm{ + }}1}}}} \\ \end{gathered} \right] = \left[ {K,\vec 1} \right]$ | (13) |
通过式(11)和式(12), 计算可得总方差为:
${\rm{var}}\left( {{y_0} - {{\hat y}_0}} \right) = \sigma _\varepsilon ^2\left( {1 + g_0^{\rm{T}}{{\left( {{F^{\rm{T}}}F} \right)}^{ - 1}}{g_0}} \right)$ | (14) |
$s_\varepsilon ^2 = \frac{1}{{n - 1}}\sum\limits_{i = 1}^n {\left( {{y_i} - {{\hat y}^2}} \right)} $ | (15) |
至此, 我们得到关于
${\hat y_0} \pm t_{n - 1}^{1 - \alpha /2}{s_\varepsilon }\sqrt {1 + g_0^{\rm{T}}{{({F^{\rm{T}}}F)}^{ - 1}}{g_0}} $ | (16) |
其中,
具体算法步骤如算法1.
算法1. LSSVM区间预测算法
1) 初始化LSSVM模型的参数;
2) 通过式(4)求解LSSVM回归模型, 得到核函数矩阵K以及
3) 给定置信度, 如
4) 通过式(9)、式(13)、式(14)、式(16)计算出最终预测区间.
1.3 模型参数优化基于LSSVM模型的区间预测方法中, 超参数的选取是否合理会极大影响预测精度, 而电网运行过程中的负荷数据在采集终端精度不足、汇总计算误差、电网事故异常等因素的影响下, 通常含有固有噪声, 针对含有噪声的样本数据, 往往很难在不考虑噪声影响的情况下选取出最优参数组合.
根据式(16)可以证明, 通过本文方法预测出的区间, 其区间的宽度与样本拟合误差
基于上述分析, 本文建立模型参数的优化目标函数为:
$\min {\rm{ }}J(m,n) = s_\varepsilon ^2 - \sigma _\varepsilon ^2$ | (17) |
根据式(3), 在LSSVM回模型中, 误差
${e_i} = {\alpha _i}/\gamma $ | (18) |
假设
$\begin{split} s_\varepsilon ^2 =& \frac{1}{n}\sum\limits_{i = 1}^n {({e_i}} - \overline {{e_i}} {)^2} = \frac{1}{n}\sum\limits_{i = 1}^n {{e_i}^2} \\ {\rm{ }} =& \frac{1}{n}\sum\limits_{i = 1}^n {\frac{{{\alpha _i}^2}}{{{C^2}}}} = \frac{{{\alpha ^{\rm{T}}}\alpha }}{{n{C^2}}} \\ \end{split} $ | (19) |
采用Gamma Test来估计样本的噪声方差, 记为
$\left\{\begin{split} & \min {\rm{ }}J(m,n) = \frac{{{\alpha ^{\rm{T}}}\alpha }}{{n{C^2}}} - {\rm{var}} (r) \\ &{\rm{s.t.}}\;{\rm{ }}{y_i} = \sum\limits_{i = 1}^n {{\alpha _i}k(x,{x_i}) + b} + {e_i},\;i = 1,\cdots,n \\ \end{split} \right.$ | (20) |
参数优化的算法步骤如算法2.
算法2. 基于噪声估计的参数优化算法
1) 计算在不同训练样本个数
2) 在LSSVM输入输出模型中, 取初始化参数
常用于评价预测区间的指标有预测区间覆盖率、区间平均宽度以及考虑区间覆盖率和区间宽度的综合评价指标, 具体描述如下:
(1) 预测区间覆盖率:PICP (Prediction Intervals Coverage Probability):
$PICP = \frac{1}{{{n_{\rm test}}}}\sum\limits_{i = 1}^{{n_{\rm test}}} {{c_i}} $ | (21) |
式中,
${c_i} = \left\{ \begin{gathered} 1,\;{({{\hat y}_{\rm out}})_i} \in [{L_i},{U_i}] \\ 0,\;{({{\hat y}_{\rm out}})_i} \notin [{L_i},{U_i}] \\ \end{gathered} \right.$ | (22) |
其中,
(2) 平均区间宽度: NMPIW(Mean Prediction Intervals Width):
$NMPIW = \frac{1}{{R \cdot {n_{\rm test}}}}\sum\limits_{i = 1}^{{n_{\rm test}}} {({U_i} - {L_i})} $ | (23) |
式中,
(3) 考虑覆盖率及宽度的综合评价指标: CWC (Coverage Width-based Criterion)
$CWC = NMPIW\left( {1 + \gamma (PICP){e^{ - \eta (PICP - \mu )}}} \right)$ | (24) |
式中,
$\gamma = \left\{ \begin{gathered} 0,{\rm{ }}PICP \ge \mu \\ 1,{\rm{ }}PICP < \mu \\ \end{gathered} \right.$ |
其中,
PICP统计真实样本落在预测区间内的概率, NMPIW统计预测区间上界和下界之间的平均宽度, 通常在同一置信水平的条件下, 预测结果的PICP越大、NMPIW越小, 则认为预测效果越好[20]. 而PICP和NMPIW是一对相互矛盾的评价指标, 因此可以使用两种指标同时兼顾的CWC作为一种更为均衡的评价指标, CWC是一个负评价指标, 其值越小越好. 在本文实验中, 将使用以上3个指标来量化预测区间的效果. 同时, 为验证模型预测效率, 实验将统计区间预测耗时CT(Cost Time of interval forecasting).
2.1 实验数据及流程取某省级电网调度负荷从2019年11月1日至2019年11月30日之间数据作为实验样本进行实验(采样频率为5分钟), 其负荷数据由省级电网从各地市局汇总计算生成, 数据曲线如图1所示. 从图中可以看出电网调度负荷随时间变化呈现出一定的波动性和周期性特征, 同时由于在采集、计算、汇总和上报等过程中的各种不确定性因素影响下, 最终统计的负荷数据会含有大量噪声.
为说明本文所提方法的有效性, 实验将本文区间预测方法(Least-squares Support Vector Interval Predi- ction, LSVIP)与文献[14]所提区间预测方法(Support Vector Interval Prediction, SVIP)进行比较, 实验流程如图2所示.
2.2 实验分析(1) 参数优化
首先根据章节1.3的模型参数优化步骤对实验样本数据进行参数优化, 通过算法2的步骤1)计算得到使噪声方差最小的参数组合为
(2) LSVIP区间预测
选取置信度为95%, 通过LSVIP方法预测区间, 其中一次区间预测结果如图3所示.
(3) 比较实验
根据图2实验流程, 将本文LSVIP方法与SVIP方法通过区间评价指标进行比较, 结果如表1.
表1中比较实验的统计结果表明, 本文所提的LSVIP区间预测方法在区间宽度、区间综合评价指标和预测速度上均优于SVIP方法.
(4) 误差分析
为更进一步说明本文预测方法的效果, 取SVIP和LSVIP预测区间的中值作为预测期望值, 并计算平均绝对百分比误差(MAPE), 20次试验的误差曲线如图4所示.
图4误差分析实验结果表明LSVIP方法在期望值的预测精度上也优于SVIP方法.
3 结论与展望负荷预测对电力系统的平衡调度和安全稳定运行具有重大意义, 在未来电网智能化发展的趋势和背景下, 其重要性愈加凸显. 本文针对此问题, 提出了一种基于LSSVM的超短期负荷区间预测方法, 该方法具有LSSVM模型计算速快速的特点, 同时使用基于Gamma Test估计出的最小有效噪声作为优化目标来计算模型参数, 在大大减少预测耗时的同时提高了预测区间的准确度.
通过电网用户负荷数据的仿真实验结果表明, 本文提出的区间预测方法在预测区间的准确度和时效性上都能满足实际工程应用的要求, 将其应用于负荷预测系统可极大提升系统精度和灵敏度, 可为电力调度工作者管理和分配发用电计划提供更为合理的依据和参考, 从而保障电网安全高效运行.
[1] |
廖旎焕, 胡智宏, 马莹莹, 等. 电力系统短期负荷预测方法综述. 电力系统保护与控制, 2011, 39(1): 147-152. DOI:10.3969/j.issn.1674-3415.2011.01.028 |
[2] |
黄文思. 考虑气象因素的短期电力负荷预测研究. 计算机应用与软件, 2020, 37(1): 98-105. |
[3] |
周旭, 来庭煜, 饶佳黎. 基于RBF神经网络模型的电力系统短期负荷预测. 通信电源技术, 2018, 35(11): 152-154. |
[4] |
吕志星, 张虓, 王沈征, 等. 基于K-Means和CNN的用户短期电力负荷预测. 计算机系统应用, 2020, 29(3): 161-166. DOI:10.15888/j.cnki.csa.007287 |
[5] |
王惠中, 杨世亮, 卢玉飞. 电网供电系统短期电力负荷预测优化仿真. 计算机系统应用, 2017, 26(8): 147-151. DOI:10.15888/j.cnki.csa.005890 |
[6] |
于佳弘, 包哲静, 李志杰. 基于LSTM的用户负荷区间预测方法. 工业控制计算机, 2018, 31(4): 100-102. DOI:10.3969/j.issn.1001-182X.2018.04.041 |
[7] |
李知艺, 丁剑鹰, 吴迪, 等. 电力负荷区间预测的集成极限学习机方法. 华北电力大学学报, 2014, 41(2): 78-88. |
[8] |
宗文婷, 卫志农, 孙国强, 等. 基于改进高斯过程回归模型的短期负荷区间预测. 电力系统及其自动化学报, 2017, 29(8): 22-28. DOI:10.3969/j.issn.1003-8930.2017.08.004 |
[9] |
任利强, 张立民, 王海鹏, 等. 基于IPSO-GPR的短期负荷区间预测. 计算机工程与设计, 2019, 40(10): 3002-3008. |
[10] |
Hall P. On bootstrap confidence intervals in nonparametric regression. Annals of Statistics, 1992, 20(2): 695-711. DOI:10.1214/aos/1176348652 |
[11] |
徐诗鸿, 张宏志, 林湘宁, 等. 基于改进评价指标的波动性负荷短期区间预测. 电力系统自动化, 2020, 44(2): 155-162. DOI:10.7500/AEPS20190123002 |
[12] |
马立新, 李渊. 区间电力负荷特征提取及预测方法. 控制工程, 2015, 22(4): 645-648. |
[13] |
韦善阳, 黎静华, 黄乾. 基于改进权值优化模型的光伏功率区间预测. 电力建设, 2019, 40(7): 26-33. DOI:10.3969/j.issn.1000-7229.2019.07.004 |
[14] |
胥少卿, 罗强一, 梁帅. 区间型时间序列数据的点预测方法研究. 系统仿真学报, 2010, 22(3): 704-707, 714. |
[15] |
Suykens JAK, Van Gestel T, De Brabanter J, et al. Least squares support vector machines [Technical Report]. Singapore: World Scientific, 2002.
|
[16] |
Stefánsson A, Končar N, Jones AJ. A note on the Gamma test. Neural Computing & Applications, 1997, 5(3): 131-133. |
[17] |
Rubio G, Pomares H, Rojas I, et al. A heuristic method for parameter selection in LS-SVM: Application to time series prediction. International Journal of Forecasting, 2011, 27(3): 725-739. DOI:10.1016/j.ijforecast.2010.02.007 |
[18] |
杨国健, 杨镜非, 童开蒙, 等. 短期负荷预测的支持向量机参数选择方法. 电力系统及其自动化学报, 2012, 24(6): 148-151. DOI:10.3969/j.issn.1003-8930.2012.06.028 |
[19] |
Khosravi A, Nahavandi S, Creighton D, et al. Comprehensive review of neural network-based prediction intervals and new advances. IEEE Transactions on Neural Networks, 2011, 22(9): 1341-1356. DOI:10.1109/TNN.2011.2162110 |
[20] |
Seber GAF, Wild CJ. Nonlinear Regression. New York: Wiley, 1989.
|