计算机系统应用  2018, Vol. 27 Issue (8): 176-179   PDF    
基于深度学习的输电线路外破图像识别技术
张骥1, 余娟1, 汪金礼1, 谭守标2     
1. 安徽南瑞继远电网技术有限公司, 合肥 230088;
2. 安徽大学, 合肥 230001
摘要:在电力系统中, 识别并排除输电线路外破风险隐患对保障电力系统的安全运行方面具有非常重要的作用. 图像识别技术是识别外破风险的一个有效方法. 针对外破隐患识别问题, 本文提出了一种通过卷积神经网络训练获取深度模型的检测算法, 该算法根据防外破风险隐患图像特点对现有深度网络结构进行了改进优化, 增加ROI池化层并修改了损失函数; 采用大量样本训练得到鲁棒模型, 测试时对待测图片首先产生候选区域, 然后针对各候选区域进行检测识别, 达到在复杂背景中检测出外破风险隐患的目的. 实验结果说明了本文方法可以有效地识别出输电线路外破隐患.
关键词: 外破隐患    卷积神经网络    深度模型    
Image Recognition Technology for Transmission Line External Damage Based on Depth Learning
ZHANG Ji1, YU Juan1, WANG Jin-Li1, TAN Shou-Biao2     
1. Anhui NARI Jiyuan Electric Power Grid Tech Co., Ltd., Hefei 230088, China;
2. Anhui University, Hefei 230001, China
Abstract: In the power system, it is very important to identify and eliminate the hidden dangers of transmission lines to ensure the power system’s security. Image recognition technology is an effective method to identify the risk of breaking out. According to the hidden breaking danger recognition problem, this study proposes a depth model by training the convolutional neural network algorithm. According to the anti breaking characteristics of risk image on the existing depth network structure are improved by increasing the ROI pool layer and modifying the loss function. A large number of training samples are used to get the robust model test when the measured image is first in generated candidate region, then the detection and identification for each candidate region are carried out, to detect potential risks to break out in a complex background. The experimental results show that this method can effectively identify the hidden danger of transmission lines.
Key words: hidden risk of external damage     convolutional neural network     depth model    

引言

在经济发展过程中, 电网是有关民生, 有关经济的重要产业, 是电力系统的主要组成部分, 有举足轻重的作用. 我国由于地域广, 电网规模大, 长距离的输电线路较多, 所以电网的运行、维护和检修则非常困难. 特别是在超高压、特高压技术迅速发展之后, 输电线路运行状态直接关系到国家经济建设, 输电线路运行维护工作责任重大. 在各种输电线路故障中, 外破已经是主要原因, 某省电网2016年220Kv以上输电线路故障原因依次为: 外破25次(施工机械碰线10次, 异物短路8次, 山火2次, 违章施工3次, 采砂船碰线1次, 车辆运输碰线1次), 鸟害18次, 雷击15次, 竹树放电1次, 风偏1次. 外破占42%、鸟害占30%、雷击占25%, 以上三项是线路跳闸的主要原因. 其中外破有是重中之重, 电力公司各级单位都采取技术和管理手段, 建立健全防外破工作机制, 提升对外破隐患识别及响应能力.

为了掌握输电线路外破情况, 国内外出现许多解决方案, 例如输电线路远程检测设备, 可以通过此设备时时检测输电线路的运行状态, 必要是发出报警[1,2]. 其中, 视频图像监控子系统, 作为系统中“可视”的辅助手段, 已在输电线路上广泛应用[3,4], 但并不对视频流进行分析处理, 还是依靠后台人员人工筛选出有隐患的图片, 这样一方面隐患告警提示不具有实时性, 另一方面加大了人力负担. 当下, 深度学习等机器学习技术有了长足的发展[5], 利用“互联网+”机器学习[6,7], 智能识别输电线路施工机械、大型车辆等外破可以大大提高故障预报的准确性和实时性[810], 提升工作效率, 节省费用.

1 系统功能

输电线路在线监测系统由主、子站两部分构成[1113]. 子站由数据监测终端和各种专业监测单元构成, 包括防外破监测、覆冰监测、微气象监测、杆塔倾斜监测、导线舞动监测、导线温度监测等. 监测子站数据单元将采集数据进行分析后通过无线APN专网、wifi或专有线路上送监测主站, 监测主站对数据进行解析、分析、展示和存储, 并及时完整地将信息反馈给特定用户. 系统主站主要负责收集各子站检测设备实时和非实时数据, 并进行储存、分析和展示. 同时与主站其它相关系统进行信息交互, 按需互通有无. 综合GIS定位“三跨”区域, 运用电网线路负荷、视频数据、雷电信息和当地的气候状况进行综合分析, 可视化展示给用户, 并通过告警推送通知相关单位, 形成联动. 该功能部署在电力系统安全IV区, 整合电网调度系统、PMS系统、GIS系统、视频数据、雷电数据和气象数据. 子站数据监测终端布置在输电线路跨越通道的杆塔上, 接收各类传感器实时数据, 系统结构如图1所示.

结合输电线路运维的实际需求, 在输电线路在线监测系统基础上研制输电线路外破隐患及预警模块. 针对目前子站装置厂家较多, 每个厂家的规约不尽相同, 系统在接入规约开发采用面向对象的方法, 实现了不同厂家设备的快速接入; 针外破隐患点(塔吊、吊车、挖掘机、水泥泵车等), 采用深度学习技术, 对多种机械的模型进行学习, 保证了静态图片中施工车辆识别的高准确度、鲁棒检测. 同时为了不断提高算法精确度, 算法不断地对现场采集的图片进行再学习, 使用样本多样性扩充技术增加样本数量及质量, 提高深度网络的鉴别能力.

图 1 输电线路在线监测系统结构

2 识别算法 2.1 算法流程

外破隐患识别算法采用卷积神经网络通过大量样本的训练学习获取深度模型, 据此进行较为准确的分析检测. 主要流程如图2所示.

图 2 算法流程

2.2 网络结构

根据检测需求, 算法采用如图3所示网络结构, 其中, Deep convnet为深度卷积网络, RoI projection 为感兴趣区域投影, Conv feature map为卷积特征图, RoI pooling layer 为感兴趣区域池化层, RoI feature vector 为感兴趣区域特征向量, regressor和softmax分别对应回归层和分类层.

图 3 网络结构图

该算法主要是基于候选区域生成的深度学习算法, 整个识别流程分为两个阶段:

(1)使用区域候选网络来提取候选框, 采用典型的VGG-16深度网络进行特征提取, VGG-16深度网络中采用13个卷积层(con1_1->conv5_3), 提取图像的特征, 其中不包括pool5及pool5后的网络层次结构. 紧接着把这些卷积特征增加两个额外的卷积层(rpn_cls_scorec层和rpn_bbox_pred层), 构造区域候选网络, 区域候选网络是一个全卷积网络. 首先使用proposal_layer来提取边界框, 根据con5_3的特征图的feature cell来提取边界框, 具体步骤如下:

每个feature cell对应输入图片提取不同尺度(64,125,256), 不同长宽比(1:1,1:2,2:1)共9个边界框, con5_3的特征图对应输入图片的映射比例为16, 假设con5_3的特征图尺度M×N, 则对应输入图片提取候选框的数目为M×N×9,去除超过图片的边界框. 最后根据边界框与GT(Ground Turth)框的IOU(Intersection-Over-Union)值来设定正负样本, 当IOU值大于0.3时设定负样本, 当IOU值小于0.7时设定正样本, 其他值舍弃.

(2)由上一阶段所得候选框作为本阶段的网络输入. 根据边界框的置信度来设置正负样本. 网络结构主要做了两点改进:

① 最后一个卷积层后加入一个ROI池化层. 通过ROI池化层使每个ROI生成固定尺寸的特征图, 该算法中ROI池化层下采样得到的特征图的固定尺寸为7x7. 由于在VGG16网络中, 卷积层conv5_3有512个特征图, 这样对于所有region_proposal, 最后产生了7*7*512维的特征向量输入到全链接层.

② 损失函数改为多任务损失函数(multi-task loss), 将边框回归直接加入到CNN网络中训练. 该阶段使用softmax替代SVM分类, 同时利用多任务损失函数边框回归也加入到了网络中. 即Softmax分类层和Bounding-Box回归层联合训练的方式更新所有参数.

每个minibatch包含N个图片(N=2), 共产生R个Proposal (R=128). 并且在从2张图中选取的128个proposals中, 需要保证与groundtruth的IOU大于0.5的prorosal个数超过总数的四分之一, 剩下的全部作为背景类. 这种方式比从128张不同图片中提取1个Proposal的方式快64倍.

2.3 候选区域产生

图4所示, 对输入图像使用卷积神经网络产生256个特征图, 滑窗使用卷积核与特征图进行卷积, 计算获得大量区域的特征向量, 使用边框回归和分类全连接层对所有区域进行排序, 取前300个区域作为候选区域. 图中, Conv feature map为卷积特征图, Sliding window为滑动窗口, intermediate layer为中间层, cls layer为分类层, reg layer为回归层.

图 4 候选区提取示意图

2.4 目标检测

使用深度网络提取各候选区域的特征并进行分类处理, 给出每个候选区域与每个车辆类别的相似置信度, 将高于一定置信度的区域作为正样本.

3 实验及结果分析

本文基于intel i7+GTX 1080GPU, 采用centos 7.0+OpenCV(3.1)+CUDA(7.5)软件系统,使用收集的3000余张图片及对这些图片中的正样本进行旋转后扩充的样本集进行模型训练, 然后使用训练得到的模型对全省各输电线路300多摄像头采集的远距离大场景复杂背景图片上进行检测, 置信度阈值设置为0.5, 得到的结果如下:

总图片数21 310张, 其中正样本图片数1817张(T), 负样本图片数19 493张(F), 正样本检出数2754张, 其中正确的正样本数1337张(TP)、错误的正样本数1417张(FP), 因而检出率TPR=TP/T=0.736, 误检率FPR=FP/F=0.073. 当前Faster RCNN在所有网络中性能领先, 其mAP=66.9, 本算法检出率高于其mAP. 如训练时结合部分实际场景图片, 则检出率将会更高、误检率更低.

部分检测结果如图5所示, 其中(a)–(c)为架空线路下几种吊车的识别结果, (b)输电线路旁建筑塔吊识别结果.

图 5 检测结果示意图

4 结语

本文尝试将深度学习算法与输电线路视频识别系统相结合, 研制出一种利用视频、图像识别对输电线路外破风险的预警模块. 具有下面几个特点:

(1)模块可以对输电线路常见外破隐患(施工机械、塔吊等)进行准确计算和识别, 实用性较强.

(2)为了保证算法的实用性, 提高算法的检测速率, 单单使用CPU计算是远远不够的, 利用GPU强大的图片处理效率, 在本算法中调用了GPU的资源进行计算, 保证算法的高效性和实用性.

GPU在浮点和并行计算方面具有独特优势, 而一般训练过程中基本都是浮点运算, 通过将数据格式转化成浮点型, 并将GPU代码改为并行运算等方式使用GPU.

(3)作为主站模块, 接入规约开发采用面向对象的方法, 快速接入不同厂家设备; 同时, 为了不断提高算法精确度, 使用样本多样性扩充技术增加样本数量及质量, 提高深度网络的鉴别能力.

经过测试与分析后, 结果表明该系统在实际应用中具有较高的灵敏性和准确性. 今后将进一步研究样本扩充技术(包括剔除噪声样本、扩充有效样本、生成特定负样本等)及改进网络结构, 以提高模型的识别准确度.

参考文献
[1]
何冰, 沈超, 朱春晖, 等. 输电线路中反大型机械外力破坏的智能预警功能的实现. 华东电力, 2011, 39(10): 1705-1709.
[2]
李力, 刘厚满, 文中. 输电线路受外力破坏应变监测方法研究. 工业安全与环保, 2011, 37(5): 30-32. DOI:10.3969/j.issn.1001-425X.2011.05.013
[3]
杨勇, 郝祉, 刘军. 在线监测系统在输电线路防外力破坏的应用. 2013年中国电机工程学会年会论文集. 成都. 2013.
[4]
刘高, 曾懿辉. 嵌入式视频和图像识别技术在架空输电线路智能监控中的应用研究. 计算机系统应用, 2013, 22(11): 58-61. DOI:10.3969/j.issn.1003-3254.2013.11.011
[5]
Szegedy C, Toshev A, Erhan D. Deep neural networks for object detection. Advances in Neural Information Processing Systems. Lake Tahoe, CA, USA. 2013.
[6]
Yu TS, Wang RS. Scene parsing using graph matching on street-view data. Computer Vision and Image Understanding, 2016, 145: 70-80. DOI:10.1016/j.cviu.2016.01.004
[7]
Brockherde, F, Vogt L, Tuckerman ME, et al. Bypassing the Kohn-Sham equations with machine learning. Nature Communications, 2017, 8(1): 872. DOI:10.1038/s41467-017-00839-3
[8]
Lenc K, Vedaldi A. R-CNN minus R. Proceedings of the British Machine Vision Conference (BMVC). Swansea, UK. 2015. 1506–1514.
[9]
Girshick R. Fast R-CNN. IEEE International Conference on Computer Vision (ICCV). Santiago, Chile. 2015. 1440–1448.
[10]
Ren S, He K, Girshick RB, et al. Faster R-CNN: Towards real-time object detection with region proposal networks. Advances in Neural Information Processing Systems. Montreal, Canada. 2015.
[11]
Ren SQ, He KM, Girshick R, et al. Object detection networks on convolutional feature maps. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(7): 1476-1481. DOI:10.1109/TPAMI.2016.2601099
[12]
Krizhevsky A, Sutskever I, Hinton GE. Imagenet classification with deep convolutional neural networks. Advances in Neural Information Processing Systems. Lake Tahoe, CA, USA. 2012.
[13]
Jia YQ, Shelhamer E, Donahue J, et al. Caffe: Convolutional architecture for fast feature embedding. Proceedings of the 22nd ACM International Conference on Multimedia. Orlando, FL, USA. 2014. 675–678.