计算机系统应用  2022, Vol. 31 Issue (5): 338-344   PDF    
道路传感器监测数据异常辨识方法
李荣磊1, 裴莉莉1, 关伟2, 袁博1, 李伟1     
1. 长安大学 信息工程学院, 西安 710064;
2. 交通运输部公路科学研究所, 北京 100088
摘要:足尺加速加载试验场具有复杂的路面结构, 其中埋设了多种传感器用于监测路面性能的各项指标. 由于传感器采集的数据具有高频海量的特点, 使用传统方法进行异常数据的辨识效率低且精度差. 针对该问题, 本文通过特定软件将原始高频采集数据进行可视化, 再将得到的可视化后数据进行类别标注, 以此作为原始数据集; 接下来针对可视化后的数据形状特征突出的特点, 本文选择了一种轻量级的卷积神经网络模型GhostNet对传感器监测数据进行异常自动辨识; 通过设计各项参数并对该网络模型进行训练, 最终在验证集上测试的结果发现: 异常数据的辨识率高达99%. 通过与常规分类模型ResNet50 (残差神经网络)对比, GhostNet网络模型的异常辨识准确率提升了11%, 能够在海量道路传感器监测数据中快速辨识异常数据, 为道路传感器故障监测提供有力的数据支持.
关键词: 道路感知    GhostNet    ResNet50    特征提取    异常数据辨识    传感器    
Anomaly Identification Method for Pavement Sensor Monitoring Data
LI Rong-Lei1, PEI Li-Li1, GUAN Wei2, YUAN Bo1, LI Wei1     
1. School of information Engineering, Chang’an University, Xi’an 710064, China;
2. Research Institute of Highway Ministry of Transport, Beijing 100088, China
Abstract: The full-scale accelerated loading test field has a complex pavement structure, in which a variety of sensors are embedded to monitor indicators of pavement performance. For the high-frequency and massive data collected by the sensors, the identification of abnormal data using traditional methods has low efficiency and poor accuracy. Considering this, this study visualizes the originally collected high-frequency data through specific software and then labels the visualized data as the original dataset. Next, according to the characteristics of obvious shape features of the data after visualization, the lightweight convolutional neural network model GhostNet is selected to automatically identify the abnormal data from the monitored dataset by sensors. Through the parameter design and the network model training, the test results on the verification set show that the identification rate of abnormal data is as high as 99%. Compared with the conventional classification model residual neural network (ResNet50), the GhostNet model has improved the anomaly identification accuracy by 11%. It can quickly identify abnormal data in massive monitored data by pavement sensors, which can provide strong data support for pavement sensor fault monitoring.
Key words: pavement perception     GhostNet     ResNet50     feature extraction     abnormal data identification     sensor    

我国交通部建立了足尺路面环道试验场[1]来更好地研究道路结构、交通荷载、气候状况等因素对道路寿命的影响问题, 通过埋设传感器对沥青路面各项性能进行测量[2], 感知数据基本能够反映不同路面结构的健康状态. 为能够准确研究车辆轮迹带的分布所导致的路面受力情况的不同, 从而进行全路域受力分析以及研究车辙演变规律, 需要及时发现该类感知数据的异常, 因此本文对车辙两侧压力感知数据展开研究.

传统的异常数据辨识需要结合主观判断来完成, 在筛查过程中需要耗费大量时间和精力, 同时人工筛查的结果在很大程度上受到人为因素的影响, 无法得到客观准确的分析结果, 导致在评价道路健康状况时出现偏差[3-6]. 近年来不少学者在数据自动检测和异常辨识方面展开了研究. Park等人[7]提出了一种基于不同感知数据的深度学习网络来辨识车辆行驶位置的方法. 在网络设计中采用了长短时记忆单元和集成学习, 并采用了特征选择技术, 在不损失性能的前提下排除了不必要的感知数据. 通过实验对所提出的深度学习网络结构进行了训练和验证. 通过4种不同的试验验证了该方法具有良好的分类性能. 金鹏等人[8]提出了一种利用深度信念网络对传感器异常数据进行检测的算法. 创新点在于对高维数据进行降维, 主要处理方法是利用文章中提到的深度信念网络对数据的特征进行提取, 并利用QSSVM结合滑动窗口模型针对降维后的数据实现了在线实时监测, 新算法不仅降低了时间复杂度, 而且获得了更好的检测效果. 使用了抽样的方法对数据做了相应的预处理以统一尺度, 之后将处理好的数据切片作为原始输入数据, 利用包含4层特征提取层的网络模型进行训练, 相比其它传统方法提高了检测精度. 钱宇骋等人[9]针对在线监测数据中异常值特点, 以及一般的异常状态检测方法是基于阈值, 噪声数据难以及时甄别的问题, 提出了一种基于灰色关联度和K-means聚类的方法, 并通过某变电站的在线监测数据对此算法进行验证, 结果表明此方法准确率高, 具有一定的实用价值. 陆秋琴等人[10]提出了一种组合异常数据检测算法(SWDS-LOF)以检测异常值, 并利用多项式拟合的方法对异常数据进行修正. 最终以某汽车公司的监测数据为例进行实证分析并验证所提算法和所建模型, 检测所得效果优异, 证明了此方法的有效性.

以上提到的对传感器异常数据辨识方法大多采用的是长短时记忆单元、聚类、阈值分割等, 数据的选取需要结合桥梁等各类复杂场景[11-13], 对数据的格式要求较高, 数据的预处理往往比较复杂[14], 之后还需要建立具体的模型不断进行调优[15], 效率低下且检测精度不高.

为解决足尺环道试验场海量感知数据异常辨识问题[16], 本文将数据可视化为图像, 在数据预处理方面不需要过于复杂的操作. 在图像分类方面, 深度学习方法往往是一种不错的选择, 其不仅具有可观的检测速度, 而且经过结构与参数上的调优, 最终能达到良好的效果[17]. 本文根据数据的各项特征选择轻量级的卷积神经网络模型GhostNet[18]进行参数与结构上的设计, 对异常数据进行辨识, 并选择传统的ResNet50[19]分类模型进行对比实验, 证明了该异常辨识方法的有效性.

1 网络原理

本文首先提取出了原始的足尺环道传感器加载数据, 结合数据特征并通过相关的可视化方法对数据类型进行了转换. 将可视化后的数据作为原始数据集, 结合数据特征较简单的特点选取了轻量级的卷积神经网络模型GhostNet, 设计了一系列输入参数并对其进行训练、测试, 结果良好. 同时又使用传统的ResNt50模型进行测试并对比分析. 整体研究步骤如图1所示.

图 1 实验技术路线

1.1 GhostNet网络结构

训练好的网络里的特征图往往存在很多冗余信息, 大部分特征长得很相似, 对于这些长得很相似的特征, 我们可以通过简单的线性变化或者滤波得到, 就没必要通过复杂的卷积运算了, GhostNet就是基于这种思想所设计的. 如图2.

Ghost模块如图2所示, 可以看到, Ghost模块分成3步:

(1)首先将输入的特征图进行卷积, 但是与常规卷积中输出的通道数为N不同, 首先通过对输入进行卷积得到特征图, 其输出的通道数为N/2;

(2)随后将特征图的每个通道单独进行某种“线性变换”;

(3)最后, 把第1次卷积和第2次卷积得到的特征图拼接在一起, 得到输出.

图 2 Ghost模块

Ghost bottleneck (G-bneck)与residual block (残差模块)类似, 主要由两个Ghost模块堆叠两次, 第1个模块用于增加特征维度, 增大的比例称为膨胀率, 而第2个模块则用于减少特征维度, 使其与输入一致.

G-bneck包含步长为1和步长为2版本, 对于步长为2, shortcut路径使用下采样层, 并在Ghost模块中间插入步长为2的纵深卷积. 为了加速, Ghost模块的原始卷积均采用点态卷积. G-bneck结构图如图3.

1.2 ResNet50网络结构

ResNet提出了残差学习的思想, 所谓残差学习是指将输入信息直接传递到输出, 与逐层传递不同, 这样的方式可以最大程度的保护信息的完整性, 整个网络只需要学习输入和输出之间差异的一部分, 从而简化了学习目标, 降低了学习难度. 该模型首先对输入做了卷积操作, 之后经过4个残差块, 最后进行全连接操作以便进行分类任务, 网络结构示意图如图4所示.

图 3 G-bneck结构

图 4 ResNet50整体结构图

2 环道感知数据集构建 2.1 数据采集

本文采用的实验数据取自交通部足尺路面环道试验场, 其中结构响应状态采集系统由若干个相关的传感器和数据采集单元组成, 能够实时、全方位的采集到各类动态响应数据. 比如温湿度传感器、多点位移计、基底应变计等, 采集的数据能够一定程度上反映路面结构性能的变化. 本文选取型号为L140的土压力计来分析其采集到的异常数据, 传感器特征如图5所示, 其主要技术参数如表1, 其中, F.S.表示满量程输出.

图 5 Sisgeo L140土压力盒图

表 1 传感器主要技术参数

2.2 高频数据可视化处理

路面埋设的传感器在不停歇采集数据, 除了车辆负载所产生的加载数据外包含许多无用的噪声, 因此第一步需要先将目标数据采用特定软件截取出来. 此时得到的加载数据特征复杂难以直接进行处理分析, 本文选择将数值型数据转换成图像进行处理, 数据可视化工具如图6所示.

图 6 DynamicAnalysis数据可视化工具

2.3 数据集建立

本文选取2019年1月到3月足尺环道STR3路段编号为P151827的土压力计采集到的数据来进行处理并作相应的分析. 感知数据经过可视化处理后可分为以下两种情况: 正常数据与异常受干扰数据, 如图7所示.

得到两类共计2 211张图像, 其中第一类包括1 099张, 第二类包括1 112张.

3 实验结果与评价 3.1 实验结果

分别对GhostNet模型和ResNet50模型进行训练, 可得到在训练集上的模型精确率和损失变化曲线如图8图9所示.

图 7 正常数据与异常数据

图 8 GhostNet模型训练集acc和loss曲线图

图 9 ResNet50模型训练集acc和loss曲线图

图8分析可知, 模型收敛速度快, 精度也较高, 而从图9可知, ResNet50网络在第8次迭代之后, 准确率与loss值基本不再发生变化, 打印网络参数可知靠后的网络层各项参数也基本不再发生变化. 这表明模型已经“过度学习”了, 我们推测由于模型的复杂度与数据特点并不匹配从而导致训练极易产生过拟合现象, 同时模型参数初始化之后也需要重新设计.

在对模型参数进行优化并且使学习率和优化器都与GhostNet相统一后, 继续训练模型, 分别选择正常数据99张, 异常数据112张图像作为验证集并对其进行测试. 两个网络的测试结果用混淆矩阵表示, 分别如图10, 图11所示.

图 10 GhostNet模型验证集结果混淆矩阵

图 11 ResNet50模型验证集结果混淆矩阵

结合验证集混淆矩阵的结果, 计算模型评价量化指标, 如表2所示.

我们选择的轻量级的网络模型GhostNet的训练及测试结果如图11表2所示, 异常数据的辨识准确率约为99%, 精度相比最开始选用的ResNet50模型改善较明显, 速度相比ResNet50模型也有较大提升.

3.2 异常数据时空对应

通过上述方法我们能够快速准确的在海量加载数据中完成对异常数据的辨识, 后续我们可以根据异常数据对应的时空信息我们可以对异常数据的来源进行具体的分析并定位, 对未来的传感器故障检测、路面破损研究也具备重大的现实意义. 部分异常数据对应的时空信息如表3所示, 从表中可以知道异常数据发生的时空信息, 例如由表3可知位于沥青层下12 cm处的土压力计在6点25分29秒左右采集到的数据为异常数据.

表 2 异常数据辨识精度评价指标

表 3 异常数据对应时空信息

4 结 论

本文结合数据可视化算法并利用GhostNet网络完成了对道路动态高频感知数据的异常辨识问题, 主要结论如下:

1)本文选取足尺环道STR3路段传感器编号为P151827的土压力计所采集的数据进行分析, 将加载过的动态高频数据通过可视化的方式进行提取, 构建数据集.

2)采用ResNet50网络模型对可视化数据进行训练和测试, 分析发现可能是由于网络参数量过多和结构复杂等原因使检测结果易发生过拟合现象, 经过调整学习率和优化器, 使之与GhostNet模型参数基本保持一致之后, 检测精度明显提升, 但速度上仍然存在不足.

3)选取一个更轻量级的神经网络模型GhostNet, 对该网络进行训练并在验证集上进行测试, 实现了对异常数据的辨识, 且检测速度和检测精度均有较大提升, 最终检测精度能够达到99%左右, 检测速度也由原来的分钟级提高为秒级.

本文提出的基于轻量级网络GhostNet的异常数据辨识模型, 能够有效快速地监测道路海量动态高频感知数据中的异常, 为道路传感器故障监测、路面健康状况研究提供有力的数据支持.

参考文献
[1]
刘正发, 陈飞. 足尺加速加载试验环道路面初步设计方案研究. 公路交通科技(应用技术版), 2013(6): 103-106.
[2]
卓琳, 赵厚宇, 詹思延. 异常检测方法及其应用综述. 计算机应用研究, 2020, 37(S1): 9-15.
[3]
Bao YQ, Chen ZC, Wei SY, et al. The state of the art of data science and engineering in structural health monitoring. Engineering, 2019, 5(2): 234-242. DOI:10.1016/j.eng.2018.11.027
[4]
Pei LL, Sun ZY, Yu T, et al. Pavement aggregate shape classification based on extreme gradient boosting. Construction and Building Materials, 2020, 256: 119356. DOI:10.1016/j.conbuildmat.2020.119356
[5]
Seventekidis P, Giagopoulos D, Arailopoulos A, et al. Structural Health Monitoring using deep learning with optimal finite element model generated data. Mechanical Systems and Signal Processing, 2020, 145: 106972. DOI:10.1016/j.ymssp.2020.106972
[6]
Chahla C, Snoussi H, Merghem L, et al. A deep learning approach for anomaly detection and prediction in power consumption data. Energy Efficiency, 2020, 13(8): 1633-1651. DOI:10.1007/s12053-020-09884-2
[7]
Park J, Min K, Kim H, et al. Road surface classification using a deep ensemble network with sensor feature selection. Sensors, 2018, 18(12): 4342. DOI:10.3390/s18124342
[8]
金鹏, 夏晓峰, 乔焰, 等. 基于深度信念网络的高维传感器数据异常检测算法. 传感技术学报, 2019, 32(6): 892-901. DOI:10.3969/j.issn.1004-1699.2019.06.014
[9]
钱宇骋, 甄超, 季坤, 等. 变压器在线监测数据异常值检测与清洗. 哈尔滨理工大学学报, 2020, 25(5): 15-22.
[10]
陆秋琴, 魏巍, 黄光球. 环境监测系统中异常数据的识别和修复方法. 安全与环境学报, 2021, 21(3): 1300-1310.
[11]
Lynch JP, Farrar CR, Michaels JE. Structural health monitoring: Technological advances to practical implementations. Proceedings of the IEEE, 2016, 104(8): 1508-1512.
[12]
Kerschen G, de Boe P, Golinval JC, et al. Sensor validation using principal component analysis. Smart Materials and Structures, 2004, 14(1): 36.
[13]
Gul M, Catbas FN. Statistical pattern recognition for structural health monitoring using time series modeling: Theory and experimental verifications. Mechanical Systems and Signal Processing, 2009, 23(7): 2192-2204.
[14]
Atha DJ, Jahanshahi MR. Evaluation of deep learning approaches based on convolutional neural networks for corrosion detection. Structural Health Monitoring, 2018, 17(5): 1110-1128. DOI:10.1177/1475921717737051
[15]
Lin YZ, Nie ZH, Ma HW. Structural damage detection with automatic feature-extraction through deep learning. Computer-Aided Civil and Infrastructure Engineering, 2017, 32(12): 1025-1046.
[16]
Zhang KG, Cheng HD, Zhang BY. Unified approach to pavement crack and sealed crack detection using preclassification based on transfer learning. Journal of Computing in Civil Engineering, 2018, 32(2): 04018001. DOI:10.1061/(ASCE)CP.1943-5487.0000736
[17]
Khodabandehlou H, Pekcan G, Fadali MS. Vibration-based structural condition assessment using convolution neural networks. Structural Control and Health Monitoring, 2019, 26(2): e2308.
[18]
Han K, Wang YH, Tian Q, et al. GhostNet: More features from cheap operations. 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle: IEEE, 2020. 1577–1586.
[19]
He KM, Zhang XY, Ren SQ, et al. Deep residual learning for image recognition. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas: IEEE, 2016. 770–778.