计算机系统应用  2021, Vol. 30 Issue (11): 304-309   PDF    
基于Bi-LSTM的结构变形预测
王亚飞1, 韩静1, 郭凰1, 廖聪1, 王立新2     
1. 长安大学 信息工程学院, 西安 710064;
2. 中铁第一勘察设计院集团有限公司, 西安 710043
摘要:伴随着社会经济的快速发展, 地铁、隧道、桥梁等建筑在人们的生活中占据的地位越来越高, 预测分析建筑的结构变形数据, 及时发现存在的安全隐患, 至关重要. 结合长短时记忆网络(Long Short Time Memory, LSTM)的优点, 本文提出了一种基于双向长短时记忆网络(Bidirectional Long Short Time Memory, Bi-LSTM)的结构变形预测模型. 该模型通过记忆时间节点前后的规律, 预测当前节点变形数据, 充分挖掘变形数据内部的关联信息. 与WNN、LSTM、GRU模型进行对比, 结果表明, 该模型RMSE、MAPE、MAE分别下降了66.0%、61.2%、66.2%, 是一种有效预测结构形变的方法.
关键词: 结构变形预测    LSTM    Bi-LSTM    WNN    GRU    
Prediction of Structural Deformation Based on Bi-LSTM
WANG Ya-Fei1, HAN Jing1, GUO Huang1, LIAO Cong1, WANG Li-Xin2     
1. School of Information Engineering, Chang’an University, Xi’an 710064, China;
2. China Railway First Survey and Design Institute Group Co. Ltd., Xi’an 710043, China
Foundation item: National Key Research and Development Program of China (2018YFC0808706); Science and Technology Project of China Railway First Survey and Design Institute Group (19-42-02)
Abstract: With the rapid development of social economy, subways, tunnels, and bridges are occupying higher positions in people’s lives. Predicting and analyzing the structural deformation data of buildings and discovering hidden safety hazards in time have become indispensable for structural safety monitoring. Combining the advantages of Long Short Time Memory (LSTM), this study proposes a structural deformation prediction model based on Bidirectional Long Short Time Memory (Bi-LSTM). The model predicts the deformation data of the current node by memorizing the rules before and after the time node and fully mines the relevant information within the deformation data. Compared with WNN, LSTM, and GRU models, this model, with RMSE, MAPE, and MAE reduced by 66.0%, 61.2%, and 66.2% respectively, proves to be an effective method for predicting structural deformation.
Key words: structural deformation prediction     LSTM     Bi-LSTM     WNN     GRU    

1 引言

随着社会的发展, 国民经济的快速增长, 地铁、隧道、桥梁等大型建筑已蓬勃兴起, 并在社会发展中起到城市脊梁的作用. 但当这些建筑的结构出现事故时, 不仅会造成巨大的经济损失, 阻碍城市的发展, 而且还会带来人员的伤亡, 给社会的稳定形成激烈地冲击. 因此, 为建筑结构进行自动化监测, 推测结构变形数据的趋势, 在出现安全隐患及时预警, 对保障生命财产安全、社会健康发展具有重要意义.

传统的结构变形预测方法有回归分析、灰色模型和时间序列模型, 根据监测数据的特点, 选择合适的预测模型. 刘波等[1]采用多元线性回归模型, 对实际高层建筑的结构变形进行了分析和预测, 取得了较好的预测效果. 回归分析模型属于静态模型, 而实际结构变形数据是动态数据, 数据之间存在依赖关系, 回归分析模型的预测结果无法准确反映结构未来变形趋势. Xiao等[2]建立一种基于最佳时间位移的二次衬砌施工灰色模型来预测隧道顶板变形. 该模型利用边界条件对GM(1,1)的权重系数进行优化, 准确地预测隧道的顶板位移. 灰色模型对于不确定因素的复杂系统预测效果较好, 但其要求累加得到的新数据满足指数特性, 限制了灰色模型在实际工程中的广泛应用. 斯建宁等[3]利用ARIMA预测隧道结构变形, 通过分析监测数据的时域特性, 推测隧道的结构形变. 时间序列模型要求数据是线性的和稳定的, 而实际结构形变数据具有复杂的非线性特征, 不适合工程结构变形数据预测.

神经网络和机器学习在结构变形预测方面具有普适性, 已经在实际工程中得到应用广泛. 吴杰等[4]提出了用小波神经网络(WNN)拟合并预测大桥位移与其原因之间非线性关系的方法, 该方法可以确定网络隐含层最优节点数, 具有良好的局部特性、较强的学习能力和任意函数逼近能力, 实现了大桥变形的精确拟合及预测, 但参数的随机初始化会导致WNN收敛速度慢甚至不收敛现象[5]. 李帅等[6]利用BP神经网络模型对基坑桩体位移进行预测, 精确地反映了实际变形趋势. Pourtaghi等[7]利用小波-人工神经网络预测最大地表沉降, 采用不同的小波作为激活函数来预测隧道开挖引起的最大地表沉降, 使预测误差值有所降低. 但样本和模型参数对该模型影响较大, 训练时容易陷入局部最优. Yang等[8]利用长短时记忆网络(LSTM)预测滑坡的周期性位移. Xu等[9]提出了基于ARIMA-LSTM的预测模型, 解决了单一预测算法无法同时求解大坝变形数据中的线性分量和非线性分量的问题. 该模型采用ARIMA模型预测大坝变形数据中的线性分量, 采用长短期记忆LSTM模型预测大坝变形数据中的非线性分量, 准确反映大坝变形趋势. 结果表明, LSTM能够记忆历史信息, 对未来结构数据进行准确预测, 但模型仅利用前向信息预测当前数据, 忽略时间点之后的结构变形数据的变化规律对当前数据的影响, 无法充分挖掘监测数据的时间特征信息, 导致预测精确度有待进一步提高.

因此, 针对LSTM模型仅利用时间序列前向信息预测当前数据的不足, 本文提出一种基于Bi-LSTM的结构变形预测模型, 研究时间节点前后的结构变形规律对当前时刻数据的影响, 并以实际沉降数据为实验依据, 通过和不同模型进行对比, 结果表明, Bi-LSTM模型充分提取了数据的时间特征, 有效地提高了模型的预测准确性.

2 基本原理 2.1 LSTM模型

LSTM[10,11]是为了解决RNN长时间依赖问题被提出的, 解决了循环神经网络的“梯度消失”和“梯度爆炸”问题. LSTM利用“记忆块”代替了传统神经网络的隐含节点, “记忆块”增加了“细胞状态”和“门”结构. 细胞状态完成了LSTM的记忆功能, “遗忘门”(ft)、“输入门”(it)和“输出门”(ot)对细胞更新和数据输出进行控制, 其内部结构如图1所示.

LSTM模块中的细胞状态 ${C_t}$ 对线性信息的进行传递, 同时隐藏层的外部结构 ${h_t}$ ${C_t}$ 处理, 完成非线性信息输出, 具体公式如下:

${c_t} = {f_t} \odot {c_{t - 1}} + {i_t} \odot \widetilde {{c_t}}$ (1)
${h_t} = {o_t} \odot \tanh ({c_t})$ (2)
$\left[ {\begin{array}{*{20}{c}} {\widetilde {{c_t}}} \\ {{o_t}} \\ {{i_t}} \\ {{f_t}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {\tanh } \\ \sigma \\ \sigma \\ \sigma \end{array}} \right]\left( {W\left[ {\begin{array}{*{20}{c}} {{x_t}} \\ {{h_{t - 1}}} \end{array}} \right] + b} \right)$ (3)
2.2 Bi-LSTM模型

LSTM及RNN都是通过前向信息推测后向数据, 但对于时间序列, 利用前向和后向的信息对当前时刻进行预测, 增强特征信息和预测值的联系, 提高了模型预测精度. LSTM预测模型仅通过单侧数据的规律进行预测, 不能充分的挖掘时间特征信息, 预测精确度需要进一步提高. 针对LSTM模型的这一不足, 提出了Bi-LSTM的预测模型. Bi-LSTM[12-14]利用两个不相关的LSTM模型, 分别从前向和后向进行数据预测, 两个模型隐含层的输出作为输出层的输入, 最后由输出层的内置函数输出最终的预测值. 如图2所示.

Bi-LSTM的隐含层有两个LSTM组成, 分别是前向隐含向量 $\overrightarrow {{h_t}} $ , 后向隐含向量 $\overleftarrow {{h_t}} $ , 将正向输入序列和反向输入序列在网络输出层结合, 则 ${y_t}$ 为最终输出值:

$\mathop {{h_t}}\limits^ \to = H({W_{x\mathop h\limits^ \to }}{x_t} + {W_{\mathop h\limits^ \to \mathop h\limits^ \to }}\mathop {{h_{t - 1}}}\limits^ \to + {b_{\mathop h\limits^ \to }})$ (4)
$\mathop {{h_t}}\limits^ \leftarrow = H({W_{x\mathop h\limits^ \leftarrow }}{x_t} + {W_{\mathop h\limits^ \leftarrow \mathop h\limits^ \leftarrow }}\mathop {{h_{t - 1}}}\limits^ \leftarrow + {b_{\mathop h\limits^ \leftarrow }})$ (5)
${y_t} = \Phi ({W_{y\mathop h\limits^ \to }}\mathop {{h_t}}\limits^ \to + {W_{y\mathop h\limits^ \leftarrow }}\mathop {{h_t}}\limits^ \leftarrow + {b_y})$ (6)
图 1 LSTM记忆模块结构图

图 2 Bi-LSTM模型结构

前向隐含向量 $\overrightarrow {{h_t}} $ 和后向隐含向量 $\overleftarrow {{h_t}} $ 在输出层有5种结合方式, 分别是: “求和”、“平均值”、“拼接”、“相乘”和“级联”, 本文把前向和后向隐含层的输出值拼接后传递网络下一层节点.

3 基于Bi-LSTM的结构变形预测

为了确保建筑结构安全, 通过自动化的监测设备对地下空间沉降进行实时监测, 利用采集的结构变形数据, 科学地预测结构未来变形趋势. 本文结合Bi-LSTM的优点, 提出一种基于Bi-LSTM的结构变形预测模型.

假设传感器监测的一组数据为 ${X_{_N}} = \left[ {{x_1},{x_2},{x_3}, \cdots ,{x_N}} \right]$ (N为采样点数), 通过分析结构变形数据和Bi-LSTM模型特点, 确定前M个监测数据为预测模型训练集, 后N–M个监测数据为预测模型测试集.

${X_{tr}} = {\left[ {\begin{array}{*{20}{c}} {{x_1}}&{{x_2}}& \cdots &{{x_L}} \\ {{x_2}}&{{x_3}}& \cdots &{{x_{L + 1}}} \\ \vdots & \vdots & \ddots & \vdots \\ {{x_{M - L}}}&{{x_{(M - L) \times L}}}& \cdots &{{x_{M - 1}}} \end{array}} \right]_{M - L + 1}}$ (7)
${Y_{tr}} = {\left[ {\begin{array}{*{20}{c}} {{x_{L + 1}}} \\ {{x_{L + 2}}} \\ \vdots \\ {{x_M}} \end{array}} \right]_{(M - L) \times 1}}$ (8)
${X_T} = {\left[ {\begin{array}{*{20}{c}} {{x_{M - L + 1}}}&{{x_{M - L + 2}}}& \cdots &{{x_M}} \\ {{x_{M - L + 2}}}&{{x_{M - L + 3}}}& \cdots &{{x_{M - L + 1}}} \\ \vdots & \vdots & \ddots & \vdots \\ {{x_{N - L}}}&{{x_{N - L + 1}}}& \cdots &{{x_M}} \end{array}} \right]_{\left( {N - M} \right) \times L}}$ (9)

其中, L是模型输入层节点个数, ${X_{tr}}$ 为训练输入, ${Y_{tr}}$ 为目标输出, ${X_T}$ 为测试输入.

对于模型正向LSTM单元, 训练集第i输入 ${X_{tr}}(i)$ , 代入式(1)至式(3)中, 得到一组状态输出 $\{ h_i^f,h_{i + 1}^f, \cdots , $ $ h_{i + L}^f\} $ .

对于模型反向LSTM单元, 训练集第i输入 ${X_{tr}}(i)$ 按照反向顺序代入式(1)至式(3)中, 得到一组状态输出 $\{ h_{i + L}^b,h_{i + L - 1}^b, \cdots ,h_i^b\} $ .

得到的两组状态输出具有相同的特征维度, 把二者进行拼接得到 ${H_i} \in {R^{2 \times L}}$ :

${H_i} = \left\{ {\left\{ {h_i^f,h_{i + L}^b} \right\},\left\{ {h_{i + 1}^f,h_{i + L - 1}^b} \right\}, \cdots ,\left\{ {h_{i + L}^f,h_i^b} \right\}} \right\} $ (10)

拼接向量通过输出层激活函数处理, 得到第i个训练输出 $\widetilde {{y_i}}$ .

模型的训练及测试过程如图3. 在模型训练时, 为了防止模型出现过拟合, 在隐含层增加正则化, 模型利用梯度下降算法更新网络权重矩阵和偏置向量. 首先, 对模型的所有参数初始化; 然后Bi-LSTM提取时间序列的前向和后向信息作为全连接层的输入, 分别计算前向隐含层和后向隐含层的输出, 并通过拼接、线性运算得出权值训练集输出 $\widetilde Y$ ; 其次利用损失函数反向传播, 对模型参数进行更新, 得出最优解; 最后利用测试集数据对训练后的模型进行测试, 把模型预测结果和真实数据进行对比, 通过预测误差评价模型的预测精确度.

图 3 Bi-LSTM预测模型

具体步骤如下:

步骤1. 把实验沉降数据划分为训练集和测试集, 并对数据进行归一化;

步骤2. 初始化模型参数, 设置模型输入层节点数, 前向、后向隐含层数及节点数, 学习步长和训练轮数;

步骤3. 利用训练集数据对模型进行训练, 确定模型最优解;

步骤4. 通过测试集数据对训练后的模型进行测试, 利用预测误差评价模型预测精确度.

4 实验 4.1 数据处理

本实验利用国内某隧道沉降数据验证模型的有效性. 监测时间为2016年3月10日至2016年12月29日, 经过处理的实验数据为1310个点, 如图4所示.

图 4 实验沉降数据

对沉降数据进行归一化, 可以加快梯度下降, 适应激活函数, 减少预测误差, 使其映射到 $\left[ { - 1,1} \right]$ 区间内. 再将数据70%划分为训练集, 30%为测试集. 归一化具体公式如下:

$\widetilde x = \frac{{x - {x_{\min }}}}{{{x_{\max }} - {x_{\min }}}}$ (11)

其中, $x$ 为原始数据, $\widetilde x$ 为归一化后的数据, ${x_{\min }}$ ${x_{\max }}$ 原始数据的最小值和最大值.

4.2 模型性能评价指标

常用来衡量预测模型性能指标有: 均方误差(Mean Square Error, MSE)、均方根误差(Root Mean Square Error, RMSE)、平均绝对误差(Mean Absolute Error, MAE)、平均绝对百分比误差(Mean Absolute Percentage Error, MARE)等, 在本实验采用RMSEMAEMAPE指标衡量Bi-LSTM模型的预测效果.

${\textit{RMSE}} = \sqrt {\frac{1}{N}\sum\limits_{i = 1}^N {{{({y_i} - {{\hat y}_i})}^2}} } $ (12)
${\textit{MAE}} = \frac{1}{N}\mathop \sum \limits_{i = 1}^N |{\hat y_i} - {y_i}|$ (13)
${\textit{MAPE}} = \frac{1}{N}\sum\limits_{i = 1}^N {\left| {\frac{{{{\hat y}_i} - {y_i}}}{{{y_i}}}} \right|} $ (14)

其中, $\widetilde {{y_i}}$ 为模型预测值, ${y_i}$ 为实际沉降值, $N$ 实验测试集样本个数.

4.3 实验结果分析

本实验为了检验Bi-LSTM模型的精准度, 利用测试输入数据预测沉降值, 并将预测结果和真实值进行对比, 对比结果如图5所示:

图5可知, Bi-LSTM模型的预测结果和真实值在整体上拟合度很高, 并且曲线的各个峰值处, 两者的数据值很接近, 预测模型的RMSEMAEMAPE分别是0.0890、0.0728和0.0073. 综合可知, Bi-LSTM模型预测结构沉降具有良好的准确性.

本实验把Bi-LSTM模型和WNN、LSTM、GRU模型进行对比分析, 结果如图6所示. WNN模型的预测结果整体上反映了沉降数据的变化趋势, 但和真实值仍存在较大误差. LSTM模型相比WNN模型预测结果具有更高的准确性, 但GRU模型通过对LSTM门结构进行优化, 能够更加有效地保留时间序列有用信息, 预测结果更加接近真实值. 基于Bi-LSTM结构变形预测模型的MAPERMSEMAE最小, 拟合度最高, 预测效果最好. 充分说明Bi-LSTM模型通过提取时间序列前向和后向的规律, 更加准确地预测沉降数据变化趋势, 弥补了其他模型仅利用单侧信息进行预测的不足, 在实际数据预测中具有更好的可行性. 为了明确不同预测方法的具体误差值, 不同的性能比较如表1所示.

图 5 Bi-LSTM预测结果

图 6 不同模型对比试验

表 1 模型性能比较

表1可知, 对比WNN、LSTM、GRU预测模型, 本实验提出的基于Bi-LSTM的结构变形预测模型, 预测结果在MAPERMSEMAE三个指标上均为最优结果. 实验结果表明本实验提出的Bi-LSTM预测模型和现有预测方法相比, 误差更小, 预测准确性更高.

5 总结

针对现有的结构变形预测模型仅通过时间序列单侧规律进行预测的不足, 本实验提出一种基于Bi-LSTM的结构变形预测模型, 同时提取变形数据前向和后向信息, 预测当前结构变形数据, 提高了预测的准确性. 最后通过和现有的WNN、LSTM、GRU模型进行对比, 有效地说明了Bi-LSTM模型具有更高的预测精度, 为结构变形预测提供更加科学的依据.

参考文献
[1]
刘波, 张斌, 喻佳, 等. 基于多元线性回归模型的大坝变形预报研究. 人民长江, 2010, 41(20): 53-55. DOI:10.3969/j.issn.1001-4179.2010.20.016
[2]
Xiao CC, Wang XM, Wang H. Displacement-based estimation of the best time for secondary lining construction using grey model GM(1,1). Geotechnical and Geological Engineering, 2019, 37(3): 1343-1355. DOI:10.1007/s10706-018-0689-2
[3]
斯建宁, 张龙. 基于ARIMA时序模型的隧道结构变形预测. 资源信息与工程, 2019, 34(2): 148-150. DOI:10.3969/j.issn.2095-5391.2019.02.065
[4]
吴杰, 余腾, 郭冰, 等. 小波神经网络在桥梁变形预测中的应用. 测绘科学, 2017, 42(11): 74-79.
[5]
刘经纬, 王普, 杨蕾. 基于自适应小波神经网络的复杂系统模式识别方法. 北京工业大学学报, 2014, 40(6): 843-850.
[6]
李帅, 李浩, 夏玉伟. BP神经网络在基坑变形预测中的应用研究. 公路与汽运, 2017(5): 97-101. DOI:10.3969/j.issn.1671-2668.2017.05.026
[7]
Pourtaghi A, Lotfollahi-Yaghin MA. Wavenet ability assessment in comparison to ANN for predicting the maximum surface settlement caused by tunneling. Tunnelling and Underground Space Technology, 2012, 28: 257-271. DOI:10.1016/j.tust.2011.11.008
[8]
Yang BB, Yin KL, Lacasse S, et al. Time series analysis and long short-term memory neural network to predict landslide displacement. Landslides, 2019, 16(4): 677-694. DOI:10.1007/s10346-018-01127-x
[9]
Ma XL, Tao ZM, Wang YH, et al. Long short-term memory neural network for traffic speed prediction using remote microwave sensor data. Transportation Research Part C: Emerging Technologies, 2015, 54: 187-197. DOI:10.1016/j.trc.2015.03.014
[10]
甘文娟, 陈永红, 韩静, 等. 基于正交参数优化的LSTM结构变形预测模型. 计算机系统应用, 2020, 29(9): 212-218. DOI:10.15888/j.cnki.csa.007606
[11]
Nihale S, Sharma S, Parashar L, et al. Network traffic prediction using long short-term memory. 2020 International Conference on Electronics and Sustainable Communication Systems (ICESC). Coimbatore: IEEE, 2020. 338–343.
[12]
Han YM, Zhou RD, Geng ZQ, et al. Production prediction modeling of industrial processes based on Bi-LSTM. 2019 34rd Youth Academic Annual Conference of Chinese Association of Automation (YAC). Jinzhou: IEEE, 2019. 285–289.
[13]
Li Z, Zhu JP, Xu XJ, et al. RDense: A protein-RNA binding prediction model based on bidirectional recurrent neural network and densely connected convolutional networks. IEEE Access, 2020, 8: 14588-14605. DOI:10.1109/ACCESS.2019.2961260
[14]
Zhang H, Song CY, Wang H, et al. Airport delay prediction based on spatiotemporal analysis and Bi-LSTM sequence learning. 2019 Chinese Automation Congress (CAC). Hangzhou: IEEE, 2019. 5080–5085.