面向电网PMU时序数据的云边协同技术

引用本文

郑晓露, 张珂珩, 陈鹏, 王玉军. 面向电网PMU时序数据的云边协同技术. 计算机系统应用, 2022, 31(7): 356-364.http://www.c-s-a.org.cn/1003-3254/8558.html

Zheng XL, Zhang KH, Chen P, Wang YJ. Cloud-edge Collaboration Technology for Power Grid PMU Time Series Data. Computer Systems and Applications, 2022, 31(7): 356-364(in Chinese).http://www.c-s-a.org.cn/1003-3254/8558.html

面向电网PMU时序数据的云边协同技术

郑晓露, 张珂珩, 陈鹏, 王玉军

国网电力科学研究院有限公司, 南京 211106

收稿日期：2021-09-29; 修改日期：2021-10-25; 采用时间：2021-11-08; csa 在线出版时间：2022-05-31

通讯作者：郑晓露, E-mail: zh_xiaolu@163.com.

摘要：相量测量单元(phasor measurement unit, PMU)时序数据在支撑电网安全稳定运行中发挥了重要作用, 而随着电网调控云建设, 电网运行数据统计分析等业务对PMU时序数据的云端共享提出了需求. 本文提出了一种面向PMU时序数据的云边协同技术, 该技术针对PMU时序数据的存储和访问特性, 构建数据协同模型架构, 实现PMU时序数据从电网调度系统生产控制区边缘节点汇集到调控云, 并通过模型化的方式进行共享. 通过在测试环境下进行实施和测试, 验证了该技术的可行性.

关键词: PMU 云边协同时序数据数据共享边缘计算大数据

Cloud-edge Collaboration Technology for Power Grid PMU Time Series Data

ZHENG Xiao-Lu, ZHANG Ke-Heng, CHEN Peng, WANG Yu-Jun

State Grid Electric Power Research Institute, Nanjing 211106, China

Abstract: The phasor measurement unit (PMU) time series data is effective in supporting the safe and stable operation of the power grid. Nevertheless, as the power grid dispatching and control cloud is constructed, services such as statistical analysis of data on power grid operation request the sharing of PMU time series data on the cloud. This study proposes a cloud-edge collaboration technology for such data. The technology builds an architecture of a data collaboration model according to the storage and access characteristics of PMU time series data so that data of this type are collected from the nodes at the edge of the production control area in the power grid dispatching system to the dispatching and control cloud and shared in a model manner. The feasibility of the proposed technology is verified through implementation and testing in a test environment.

Key words: phasor measurement unit (PMU) cloud-edge collaboration time series data data sharing edge computing big data

目前PMU/WAMS系统已经在我国电力系统的实时监测、振荡告警、扰动和事故分析等方面发挥日益重要和显著的作用^[1], 通过对广域分布的电力系统的电气量, 尤其是相量进行实时测量, 为解决大型电力系统的安全分析和稳定控制等问题提供了重要支撑^{[2, 3]}. 目前典型的PMU数据存储技术路线是采用时间序列数据库^[4], 通过统一支撑平台的集成, 实现PMU采集数据的存储入库以及WAMS系统的应用^[5].

目前电网调控数据由于数据源系统较多, 各系统数据存在缺乏统一规范标准、数据分散、关联程度低等问题, 系统间交互能力有限, 数据共享困难^[6]. 云计算技术由于在扩展性、可靠性方面的优势, 成为电网调控数据共享的主要研究方向. 国家电网公司通过建设调控云, 将云计算的特征和电网调度业务的实际需求相结合, 运用虚拟化平台、多层次存储体系、智能化运维等技术, 提供基础设施服务、运行环境支撑、模型数据服务等, 提升了调控系统应用平台的支撑能力以及电网运行的智能化水平和全局监控能力^{[6, 7]}, 满足各级调控中心数据共享的需求. 南方电网公司也与阿里云签署合作备忘录, 合作建设南网调度云平台, 整合全网的运行基础数据, 实现了各级调度资源和数据的共享. 为实现云端数据共享, 文献[7]提出了主导节点、协同节点的概念, 按照源端产生、全局共享方式进行数据流的规划. 对于全局统一的元数据、字典数据, 全部由主导节点产生, 各协同节点和业务系统只可以使用. 对于运行数据, 全部由业务系统产生, 汇集到协同节点和主导节点. 针对调控云端和调控系统的云边协同, 文献[8]提出了一种基于边缘计算的云边协同控制方式, 通过关联矩阵建立云边协同的电力物联网计算模型. 文献[9]从边缘计算的角度研究了适用于电力系统的应用范式和服务框架, 并提出了边缘计算在广域发电控制、站域保护控制与符合建模评估三大场景的技术分析和应用方案. 文献[10]提出了层次化的云边协同模式, 低层支持数据的临时存储, 高层支持数据半永久存储. 由于PMU数据采集密度高、数据量大^[6], 一直未有一套完整的云边协同方法, 支撑PMU数据的云端共享.

云边协同一般包括资源协同、应用协同、数据协同、智能协同等多种协同^[11]. 本文阐述的PMU数据云边协同方法, 主要从数据协同角度介绍了从调控系统内部PMU数据的采集存储, 到云端PMU数据的汇集和共享的整体技术路线. 针对PMU数据采集密度高、数据量大的问题, 采用了多通道收发、自动补录等方法, 保证了云端PMU数据的汇集的实时性和可靠性. 针对PMU数据的访问, 提出了云端PMU数据的关联存储模型和访问服务, 便于上层应用获取PMU数据.

1 数据协同模型

目前WAMS系统一般通过部署在生产控制大区(Ⅰ区)调控系统支撑平台的消息总线接收前置发送的实时PMU数据, 存储在时序数据库中. 根据数据使用场景将PMU数据分为3类, 实时数据、历史数据、案例数据. 实时数据表示PMU当前时刻的最新数据, 历史数据表示一段时间累计的数据, 案例数据表示发生电网扰动等事件前后几分钟的数据. 根据调控云平台国(分)主导节点+省(地)协同节点的二级部署体系^{[12, 13]}, 基于某一个省(地)云环境下, 整体数据协同模型如图1所示, 主要包括数据跨区同步、数据汇集、数据存储和共享3部分.

数据跨区同步是指将PMU时序数据从调控系统Ⅰ区, 同步到Ⅲ区, 主要包括实时数据的同步、异常恢复数据补录、重要事件案例数据同步.

数据汇集是指多个调控系统将各自的PMU时序数据按照云端的要求发送到云端, 云端统一接收.

数据存储和共享是指云端进行PMU时序数据统一存储, 并提供基于模型的数据访问服务.

2 技术原理 2.1 跨区数据同步

由于PMU采集频率一般为25–100 fps, 按照10000个测点量计算, 存储一个月的数据需要近4 TB的存储空间^[6], 所以时序数据库存储PMU数据时采用循环删除的机制, 一般只循环保存1–3个月的历史数据. 针对PMU数据采集频率高、数据循环删除的特性, 跨区数据同步采用数据报文传输形式进行, 需要实现以下3个数据流.

(1)实时数据同步: 如图1的②–⑤, 从Ⅰ区消息总线接收PMU消息报文, 格式转化后发送到Ⅲ区. 实时数据同步通道于现有时序数据库写入通道独立, 避免影响现有时序数据库的正常写入, 且通过消息总线保证实时同步的数据和时序数据库中的数据一致性.

(2)历史数据补录: 如图1的③–⑥、⑭–⑮, 云端发送数据历史数据补录的协同命令, 从Ⅰ区时序数据库获取历史数据, 格式转化后发送到Ⅲ区. 历史数据补录主要应对的场景Ⅰ区和Ⅲ区之间的网络通道故障等异常导致数据不能实时同步, 在故障恢复之后进行自动的历史数据补录.

(3)案例数据同步: 如图1的④–⑦、⑭–⑮, 云端发送数据案例数据同步的协同命令, 从Ⅰ区时序数据库获取电网重要事件前后5分钟的历史数据, 格式转化后发送到Ⅲ区.

数据同步的数据报文格式如图2所示: 主要包括设备ID、量测类型、数据类型、数据时间、值、质量码6部分. 设备ID和量测类型用于唯一确定一个PMU设备的特定监测指标, 数据类型用于表示是实时数据、历史数据还是案例数据. 因PMU采集的数据是等周期的, 所以使用一个秒级时间精确指示该报文中的数据采集时间, 值和质量码分别通过连续的50/100个数表示该秒采集的50/100帧数据值和质量码.

图 1 PMU数据协同模型

图 2 同步数据格式设计

2.2 数据汇集

Ⅰ区数据同步模块通过隔离网闸将PMU数据发往Ⅲ区之后, 由Ⅲ区数据转发模块转发至云端. 目前主要的数据转发手段有: 基于E文件和ftp传输^[14]、基于数据同步组件^[15]、基于消息组件^[16]等. 基于E文件和ftp传输适合非数据库之间直接的转发, 基于同步工具的转发适合关系型数据库之间的数据同步复制, 基于消息组件的转发适合对数据实时性要求比较高的场景. PMU数据协同采用消息队列进行数据汇集, 并在数据压缩和并行汇集方面进行优化提升.

2.2.1 面向PMU时序数据的拟合压缩技术

通过将PMU时序数据压缩, 可有效减少网络传输的数据量, 提升数据汇集的效率. 常用的压缩方式有无损压缩和有损压缩, 文献[17]提出的混合熵编码并行压缩算法和文献[18]提出的有损压缩比的动态控制方法, 分别在无损压缩和有损压缩进行了优化研究. 本文针对PMU数据量大、汇集实时性要求高, 且注重数据趋势的特性, 拟采用一种分段拟合方式的进行有损压缩, 既有较高的压缩率, 也便于实时数据同步发送.

分段拟合算法的关键思路是: (1)每秒内的最大和最小值预先保留, 确保数据曲线的波峰和波谷不丢失, 减少压缩对数据趋势的影响; (2)通过拟合算法, 将符合拟合标准的数据去除, 只保留超过拟合偏差的数据, 减少需要存储的数据量, 达到压缩的目的.

设置当前已有N个测点T_all秒的数据, 分段的时间跨度为S秒, 将原历史数据按时间跨度拆分成M段, M=T_all/S, 各时间段组成集合T={ T₁, T₂, …, T_M }; 设置拟合压缩的误差为delta. 算法针对N个测点的M个时间段分别进行压缩处理, 然后进行结果合并. 每个时间段的处理流程如下.

(1) 针对每个T_i∈T, 获取T_i时间段内的所有数据V={ V₁, V₂, …, V_count }, 计算这段时间的最大和最小值V_imax和V_imin;

(2) 设置压缩的中间节点为node1和node2, 将集合V拆成3段, [V₁, V_node1), [V_node1, V_node2), [V_node2, V_count];

(3) 比较V_imax和V_imin的时间T_imax和T_imin, 如果T_imax<T_imin, 设置T_node1=T_imax、T_node2=T_imin; 否则T_node1=T_imin、T_node2=T_imax;

(4) 进行[V₁, V_node1)段的拟合压缩, 设置起始V_start=V₁, 结束V_end=V_node1;

(5) 计算从start至end的每个值的拟合偏差D_i:

$ {D_i} = \left| {{V_{\rm{start}}} + \frac{{{V_{\rm{end}}} - {V_{\rm{start}}}}}{{{T_{\rm{end}}} - {T_{\rm{start}}}}} \times ({T_i} - {T_{\rm{start}}}) - {V_i}} \right| $

(6) 比较D_i和delta大小, 如果D_i<delta, 则删除V_i; 否则保留V_i, 并将V_start重新设置为V_i;

(7) 重复执行步骤(3)–步骤(4), 从start执行到end, 保留的数据集合为V_result;

(8) 进行[V_node1, V_node2)段的拟合压缩, 设置起始V_start=V_node1, 结束V_end=V_node2, 执行步骤(5)–步骤(7);

(9) 进行[V_node2, V_count]段的拟合压缩, 设置起始V_start=V_node2, 结束V_end=V_count, 执行步骤(5)–步骤(7);

(10) 合并步骤(4)、步骤(8)和步骤(9) 3个步骤的结果数据集合V_result, V_result即为最终压缩后的结果.

算法示意图如图3所示, 图中V₂、V₄、V₅、V₆符合拟合压缩条件, 被压缩, V₈不满足拟合压缩条件, 被保留.

图 3 拟合压缩算法示意图

2.2.2 面向量测类型的消息并行处理技术

PMU接入的数据类型主要有相量(电压、电流、内电势相量、内电势功角、母线电压相量等)、模拟量(励磁电压、励磁电流、频率偏移量、频率变化率、机组转速量、机组AGC模拟量、机组AGC升脉冲增量、机组ACGC降脉冲增量等)、开关量(机组开关、机组AGC投入等) 3种^[19]. 为提升消息转发的并行性和效率, 通过数据类型将消息队列的消息设置成不同的消息主题. 如图4所示, 云端部署消息队列组件和多个接收程序, Ⅲ区的数据转发模块将PMU数据按照电流、电压、频率等分为不同的主题发到消息队列中, 不同的接收程序解析不同主题的消息后, 写入云端时序数据库.

数据转发模块, 采用定时任务触发方式. 使用算法1所示算法, 通过时间轮算法将任务平均分配到多个时间点, 并通过一致性Hash算法将任务发布到指定的节点上执行. 该算法能够避免所有任务同时触发造成消息拥塞, 也能保证任务的可靠执行. 主要算法如图5所示.

算法1. 基于时间轮和一致性Hash的任务发布算法

/* 初始化每个任务的位置, 和触发时间 */

/* VT为所有任务的集合, 每个周期的任务链为chain */

for each tast∈VT do

cacluate task.position = e.Time % 12

cacluate task.round = e.Time / 12

set chain[posion] = chain[posion] + task

end

/* 任务触发和发布执行 */

while(true) do

get current position pos

for each task tast∈chain[pos] do

if task.round = 0 then

cacluate task.hash and IP position

IP_N.hash < task.hash < IP _N+1.hash

dispath tast to node on IP_N+1

end

if pos = 12 then

for each tast tast∈VT do

set task.round = task.round–1

end

2.3 云端数据存储

电力调度通用数据对象结构化设计规范^[20]中对电网运行数据的存储结构定义中, 量测类数据主要存储的信息有时间、对象ID、量测类型、数据源标识等. PMU数据在云端的存储参考该规范定义, 结合PMU数据量大、无事务要求的特性, 采用具备高可扩展能力和良好的容错能力^[21]的Key-Value型数据库进行存储. 根据汇集上云的数据类型, 设计将数据分别保存到历史数据存储实例或案例数据存储实例, 分别用于周期保存一定时间的历史数据以及永久保存案例数据. 历史数据存储实例或案例数据存储实例存储结构一致, 如表1所示.

图 4 数据汇集方法

图 5 数据汇集任务调度算法

Key值为数据源标识、量测类型、设备ID、时间的顺序组合, Value存储Key值对应的PMU监测指标在该秒的所有帧的值和质量码, 通过“#”分割成一串字符串存储. 设计该存储结构的优点如下.

(1) Key值的高位为数据源标识和量测类型, 对于云端汇集的各地PMU数据可以充分利用Key-Value数据库分布式存储的特性, 将数据分布到各数据库节点, 写入和查询并行度高, 且数据分布范围大, 不容易产生写入热点问题.

(2)通过将一个PMU监测指标1秒钟所有帧的数据和质量码合并成一个字符串, 作为一条Value存储, 减少了数据库读写的次数, 提升了数据写入和查询的效率.

表 1 Key-Value数据库存储结构示意图

为提升数据存储的效率以及可靠性, 采用多个存储执行器并行处理的架构, 并采用算法2所示负载均衡算法, 根据活跃执行器的个数进行动态的负载均衡.

算法2. 多节点任务负载均衡算法

/* VE为所有执行器executor的集合, 所有写入的key的总数为N */

begin

set alive_executor_count = 0

set executor _seqence = 0

for each e∈VE do

if e is alive then

set alive_executor_count + 1

set e.seqence = executor _seqence + 1

else VE = VE–e

end

calculate avg_key = N/executor _seqence

for each e∈VE do

if e is last Executor then

set e.start = avg_key * e. seqence

set e.end = N

else

set e.start = avg_key * e. seqence

set e.end = avg_key * (e. seqence + 1)

end

2.4 云端数据共享

为提升数据共享的易用性, 云端提供两种数据共享模式: 主动数据访问模式和消息订阅模式, 同时通过使用关系型数据库存储电网模型, 提供基于模型的数据访问服务, 如图6所示.

存储层通过Key-Value型数据库存储PMU的历史数据和案例数据, 同时利用关系型数据库存储3类关系表: 电网模型表、量测信息表、案例信息表. 电网模型表和量测信息表用于提供基于电网模型的数据共享. 电网模型表主要包括厂站表、发电机表、变压器绕组表等表示电网设备的表, 量测信息表主要结构如表2所示, 存储时序库中存储的测点与所属厂站、设备的关联关系, 以及和和云端汇集后统一设备ID^[20]之间的映射关系. 案例信息表主要表结构如表3所示, 保存WAMS系统中事件发生的时间以及相关的设备信息.

图 6 云端数据共享方法

表 2 量测信息表结构

表 3 案例信息表结构

访问层以服务化方式将云端设备ID、厂站ID等设备统一编码转换为时序库数据存储ID, 进行时序数据库中PMU数据定位与查询. 数据访问方式如下.

(1)提供数据访问接口, 支持基于接口的数据访问, 供高级应用调用.

(2)通过“区域-厂站-设备-量测”树状结构的展示界面, 显示PMU数据.

(3)通过云端内部消息队列, 将应用订阅的PMU数据推送至应用.

3 测试验证

通过本地服务器和阿里云环境, 搭建测试环境进行PMU数据云边协同可行性验证, 模拟PMU测点1万个, 采集频率为50 fps. 物理环境如图7所示.

图 7 验证环境物理部署图

所需使用资源具体如表4所示.

验证环境部署步骤如下.

表 4 验证环境部署配置

(1)在PMU数据接收服务器上部署PMU系统数据发送程序, 从平台的消息总线中实时接收PMU数据, 并发往Ⅲ区.

(2) Ⅲ区PMU转发服务器上部署转发上云模块, 调用消息队列MQ的接口通过消息方式推送数据.

(3)在云平台中消息接收服务器1和2上部署接入程序, 将消息中的设备ID、量测类型、数据时标等转为TDSB数据库的Key值, 并写入PMU数据.

(4)在云平台MySQL数据库中建立设备表、厂站表、量测信息表、案例信息表, 录入WAMS系统对应的设备ID及相关信息, 以及TSDB对应的Key值信息.

(5)在云平台服务器上部署查询服务和订阅通知服务, 查询服务将输入的云端统一设备ID等查询条件, 通过查询MySQL的映射表转化为TSDB对应的Key值, 调用TSDB查询接口查询数据.

同时, 针对云边协同中数据汇集、存储等关键场景, 进行效率和参数的测试验证, 主要验证以下场景.

(1)跨区数据同步效率测试

测试不同大小的文件跨区同步的效率, 测试参数和测试结果分别如表5和图8所示.

通过对比发现, 大文件跨区传输效率远高于小文件的传输效率. 大文件传输效率约为10 MB/s, 满足1万个PMU测点每秒50帧的数据跨区同步.

(2)拟合参数对比测试

测试设置不同的拟合参数, 对压缩率和拟合结果的影响. 测试参数和测试结果分别如表6和图9所示.

对比实验结果发现, 拟合误差较少时, 能够较好地拟合原有曲线, 压缩掉的点也少; 压缩单元跨度不宜设置过大, 否则可能将曲线的波峰和波谷压缩掉.

表 5 跨区同步测试参数

图 8 跨区同步测试结果

表 6 拟合参数设置

图 9 拟合参数测试结果

(3)时序数据库写入和查询能力测试

测试不同并发场景下时序数据库的写入和查询能力. 测试参数和测试结果分别如表7和图10所示.

数据写入效率: 单连接和多连接分别为20315 和39760 条/秒; 数据查询效率: 单连接和多连接分别为193498和675858 条/秒. 满足1万个PMU测点的数据存储和查询需求.

表 7 时序库读写测试参数设置

图 10 时序库写入和查询测试结果

4 总结与展望

本文针对PMU时序数据的共享需求, 提出一种PMU时序数据的云边协同方法, 介绍了该方法的数据协同模型、数据汇集架构与拟合算法、数据访问服务等关键技术, 并通过阿里云的实际环境验证测试该方法的可行性. 目前该方法还有两处待改进: (1)数据在云端汇集后, 对于缺失或者需要重传的数据, 需要在云端提供历史数据补招功能; (2)云端PMU数据汇集后, 针对电网事件对PMU案例数据分析时, 缺乏事件发生时刻对应的模型. 针对这两个问题, 本文下阶段的目标是研究历史补招命令的下发执行, 以及历史模型动态匹配方法.

参考文献

[1]	邢金, 郭子明, 张昊, 等. PMU/WAMS广域监测与控制系统的认识与展望. 华北电力技术, 2015(9): 18-21.
[2]	Xiao JY, Xie XR, Li HJ, et al. Power system dynamic security assessment via synchrophasor monitoring. 2004 International Conference on Power System Technology. Singapore: IEEE, 2004. 930–935.
[3]	Phadke AG. Synchronized phasor measurements in power systems. IEEE Computer Applications in Power, 1993, 6(2): 10-15. DOI:10.1109/67.207465
[4]	戴则梅, 葛云鹏, 张珂珩, 等. 电网广域监测系统的数据库集成方案. 江苏电机工程, 2013, 32(1): 1-4.
[5]	高宗和, 戴则梅, 翟明玉, 等. 基于统一支撑平台的EMS与WAMS集成方案. 电力系统自动化, 2006, 30(16): 41-45. DOI:10.3321/j.issn:1000-1026.2006.16.009
[6]	徐浩, 武毅, 董向明, 等. 基于调控云的电网调控数据信息共享的研究. 湖北电力, 2018, 42(5): 17-24.
[7]	阙凌燕, 蒋正威, 肖艳炜, 等. 调控云关键技术研究及展望. 浙江电力, 2019, 38(8): 1-7.
[8]	司羽飞, 谭阳红, 汪沨, 等. 面向电力物联网的云边协同结构模型. 中国电机工程学报, 2020, 40(24): 7973-7979.
[9]	白昱阳, 黄彦浩, 陈思远, 等. 云边智能: 电力系统运行控制的边缘计算方法及其应用现状与展望. 自动化学报, 2020, 46(3): 397-410.
[10]	陈玉平, 刘波, 林伟伟, 等. 云边协同综述. 计算机科学, 2021, 48(3): 259-268. DOI:10.11896/jsjkx.201000109
[11]	周悦芝, 张迪. 近端云计算: 后云计算时代的机遇与挑战. 计算机学报, 2019, 42(4): 677-700. DOI:10.11897/SP.J.1016.2019.00677
[12]	张勇, 郭骏, 刘金波, 等. 调控云平台IaaS层技术架构设计和关键技术. 电力系统自动化, 45(2): 114–121.
[13]	杨清波, 陈振宇, 刘东, 等. 基于容器的调控云PaaS平台的设计与实现. 电网技术, 2020, 44(6): 2030-2037.
[14]	陈然. 大规模电网运行数据实时同步技术研究. 云南电力技术, 2015, 43(5): 24-26. DOI:10.3969/j.issn.1006-7345.2015.05.008
[15]	李辉, 帅强, 李伟. 基于计量自动化系统数据同步至云数据中心技术研究. 电子技术与软件工程, 2019(23): 165-166.
[16]	王震, 陈亮. 基于Kafka消息队列的电网设备准实时数据接入方法研究. 山东电力技术, 2015, 42(6): 41-43. DOI:10.3969/j.issn.1007-9904.2015.06.009
[17]	骆金维, 曾德生, 郭雅, 等. 时序数据并行压缩速率改进技术研究. 电子设计工程, 2018, 26(20): 98-101. DOI:10.3969/j.issn.1674-6236.2018.20.021
[18]	刘佳宝, 梁奕, 方俊. 一种过程数据有损压缩比的动态控制方法. 计算机工程与应用, 2013, 49(8): 138-141. DOI:10.3778/j.issn.1002-8331.1108-0374
[19]	孙鹏武, 翟桂湘, 张力. PMU在西北电网自动化系统中的接入. 陕西电力, 2007, 35(7): 18-21.
[20]	许洪强. 面向调控云的电力调度通用数据对象结构化设计及应用. 电网技术, 2018, 42(7): 2248-2254.
[21]	闫湖, 周薇, 李立新, 等. 基于分布式键值对存储技术的EMS数据库平台. 电网技术, 2012, 36(9): 162-167.