2. 安徽大学, 合肥 230039
2. Anhui University, Hefei 230039, China
浓雾作为一种灾害性天气现象, 近年来受到越来越广泛的关注. 雾导致的视程障碍对交通的安全带来严重影响[1–3]. 近年来, 随着经济的发展和全球气候变暖加剧, 中国区域大气能见度整体呈下降趋势, 其中东部地区下降趋势最为明显[4–7]. 低能见度天气的增多成为诱发交通事故的主要气象因素, 如我国2017年道路交通事故万车死亡人数为2.06人[8], 成为危害人身安全的重要因素之一. 准确预报出大雾的生成、发展和消亡能有效减少交通事故的发生. 为此, 交通和气象部门开展了广泛合作, 以减少低能见度因素导致交通事故发生. 周须文等[9]应用天气学原理和数理统计方法对低能见度雾的生消机理进行研究, 建立能见度与气象因子的回归方程, 从而对雾的等级进行预报; 吴彬贵等[10]、黄政等[11]基于数值预报模式数据, 结合逆向传播(BP)神经网络或具体的要素阈值来判别雾是否出现, 在雾的预报方面做出了积极的探索. 也有学者在对大雾中平流雾气象要素特征分析的基础上, 给出了预报思路, 在实际应用中取得较好的效果[12]. 在已有的大雾预报研究中, 大多为短期预报(未来24小时大雾是否发生), 空报和漏报率较高. 因此, 大雾临近预报显得尤为重要, 目前关于大雾的临近预报的研究相对较少.
随着人工智能的兴起, 一些深度学习算法相继出现[13–15], 基于深度学习的短期天气预测已成为一种新的趋势[16]. 深度学习算法中循环神经网络(RNN)是一种适合序列数据的模型[17], 能够提取时间序列数据中的有效信息, 已广泛应用于股票预测、语音识别等领域[18,19]. 长短期记忆网络(LSTM)[20]是一种特殊的循环神经网络(RNN), 适合处理和预测时间序列相对较长的重要事件. 与RNN相比, 它解决了RNN训练过程中梯度爆炸和梯度消失的问题, 可以学习长期的依赖信息. 近年来LSTM在各行业中得到较为广泛的应用[21–23]. 本文提出了一种基于LSTM的网络模型, 该模型通过自动提取气象要素历史数据中的相关信息, 预报未来4小时内逐小时能见度的变化, 是对以往利用经验预报的有效补充.
1 LSTM大雾预报模型的设计建模数据选取安徽省81个国家站2015年10月1日到2017年6月1日逐时地面气象数据. 要素包括气压、气温、露点温度、降水量、风速、风向和能见度.
1.1 预报模型的建立LSTM是一种RNN神经网络, 每个LSTM单元增加了三个门, 即输入门, 忘记门和输出门. 与RNN相比, 解决了RNN训练过程中梯度爆炸和梯度消失的问题, 可以学习长期的依赖信息. 对于时间序列
${i_t} = \sigma ({W^{(i)}}H + {b_i})$ | (1) |
${f_t} = \sigma ({W^{(f)}}{H_{(f)}} + {b_f})$ | (2) |
${o_t} = \sigma ({W^{(o)}}{H_{(o)}} + {b_o})$ | (3) |
${C_t} = \tanh ({W^{(c)}}{H_{(c)}} + {b_c})$ | (4) |
${C_t} = {f_t}*{C_{t - 1}} + {i_t}*{C_t}$ | (5) |
${h_t} = {o_t}*\tanh ({C_t})$ | (6) |
其中,
本文基于LSTM模型提出了一种大雾预报框架, 基本原理如图2所示. 每小时返回的气象要素数据根据需要被转化成不同长度的时间序列, 并将其作为网络的输入时间序列
1)首先, 将气象要素时间序列X作为输入进入输入层.
2)LSTM接收输入向量, 结合Cell在上一时间点的输出, 当t=1时, 隐藏层状态为0. LSTM的输入门和忘记门分别由Sigmoid函数值决定要输入的信息, 进入存储单元时存储单元应该忘记哪些信息. 输入门和隐藏门的输出更新隐藏层的状态,根据单元状态决定输出信息, 最终Cell输出当前单元.
3)然后, 将下一时间点的气象要素
4)最后, 将LSTM的最后时间步的输出输入到全连接层. 全连接层进一步提取气象要素时间序列的特征, 最终输出预测大雾的类别的标签.
2 实验与分析通过将逐时气象要素数据处理成时间序列以构建数据集, 从2015年10月到2016年12年的数据中随机选出1500个正样本和1500个负样本作为验证集, 使用剩余数据构建训练集.利用2017年1月到2017年6月的数据构建测试集. 具体制作时间序列的方式为: 预测未来小时雾是否存在, 先选择前一段时间的气象要素数据构建时间序列, 使用下一小时的能见度作为训练标签. 通常大家关心的是有雾状态, 因此标记时间序列的标准是当能见度值小于1000米时, 标记为有雾, 否则, 则标记为无雾. 例如, 第1至第4个小时为一个时间序列, 第5个小时的能见度值则为标签. 第2至第5个小时作为时间序列, 用第6各小时能见度值构建标签. 在预测未来1–2小时能见度时, 选择的时间序列长度为2, 预测3–4小时能见度时选择的时间序列长度为4. 训练样本和测试样本的数量见表1. 在样本中, 有雾的样本相对较少, 这就造成了正负样本比例严重不平衡, 其比例约为1:20. 本文使用随机过采样的方法对训练正样本进行数据扩充, 使最终正负样本比例为1:2 (在本文中, 正样本为有雾, 负样本为无雾.). 测试集按照真实情况下取出的正负样本的数量. 当预测未来1到2小时是否有雾时我们选择的时间序列长度2. 预测3到4小时选择时间序列的长度为4.
由于各气象要素因子数值区间的差异性较大, 在数据使用前对原始数据做归一化处理, 将各个因子缩放到一个尺度, 公式如下:
$\mathop x\limits^* = \frac{{x - {x_{\min }}}}{{{x_{\max }} - {x_{\min }}}}$ | (7) |
式中,
为了评估训练模型的性能, 本文选用precision, F1-score, accuracy和TS-Score作为评价指标[24,25], 指标公式如下:
$precision = TP/(TP + FP)$ | (8) |
$F1 = 2*precision*recall/(precision + recall)$ | (9) |
$recall = TP/(TP + FN)$ | (10) |
$accuracy = (TP + TN)/(TP + TF + NP + NF)$ | (11) |
$TS = TP/(TP + FP + FN)$ | (12) |
其中, TP是正样本被正确分类的样本数, TN是负样本分类正确的样本数量; recall是指正样本被正确分类数量与总正样本的比率; FN指正样本被分类为负样本的数量; FP是负样本被分类为正样本数量; TS-Score则是一种气象部门广泛用来评价预测效果的指标.
本文使用了交叉熵做为雾预测的目标函数, 目标函数如下:
$loss = - \sum\nolimits_i^K {{y_i}\ln {f_i}(x)} $ | (13) |
式中,
设计的实验应用于Intel i7 3.4 Ghz*8, 16 GB内存和英伟达GTX1080. Ubuntu16.04操作系统, 网络框架是基于Tensorflow1.4.0[26].
表2给出了LSTM与CNN以及传统的SVM、KNN对未来1–4小时的大雾预测结果的对比. 从表2中可以看出在对未来1–4小时的预测, LSTM在四种评估标准的结果优于SVM、KNN以及CNN方法的预测结果. 用该方法对未来4小时预测的TS-score分别为61%, 55%, 36%和31%. 由此可以发现基于LSTM的预测模型相比于CNN以及传统的分类模型SVM、KNN, 在预测精度上有明显优势.
3 结语
本文基于LSTM网络提出了一个新的临近大雾预报框架, 与传统的大雾预报方法不同, 该框架基于气象要素时间序列数据进行建模. 利用安徽省国家地面气象观测站气象要素转换的时间序列数据, 该框架能够有效地预测未来1–4小时的大雾生成情况. 对比分析发现, 和当前比较常见的CNN、SVM、KNN等其他机器学习方法相比较, 本文提出的预测框架能够达到更好的预测效果.
[1] |
吴兑, 邓雪娇, 毛节泰, 等. 南岭大瑶山高速公路浓雾的宏微观结构与能见度研究. 气象学报, 2007, 65(3): 406-415. DOI:10.3321/j.issn:0577-6619.2007.03.009 |
[2] |
李秀连, 陈克军, 王科, 等. 首都机场大雾的分类特征和统计分析. 气象科技, 2008, 36(6): 717-723. DOI:10.3969/j.issn.1671-6345.2008.06.008 |
[3] |
崔新强, 周小兰, 付佳, 等. 高速铁路安全运行高影响天气条件等级标准研究. 灾害学, 2016, 31(3): 26-30. DOI:10.3969/j.issn.1000-811X.2016.03.005 |
[4] |
黄健, 吴兑, 黄敏辉, 等. 1954—2004年珠江三角洲大气能见度变化趋势. 应用气象学报, 2008, 19(1): 61-70. DOI:10.3969/j.issn.1001-7313.2008.01.009 |
[5] |
范引琪, 李春强. 1980—2003年京、津、冀地区大气能见度变化趋势研究. 高原气象, 2008, 27(6): 1392-1400. |
[6] |
刘晓舟, 许潇锋, 杨军. 华东三市能见度、气溶胶和太阳辐射变化特征. 气象科技, 2013, 41(2): 352-359. DOI:10.3969/j.issn.1671-6345.2013.02.027 |
[7] |
刘骞, 盛立芳, 王园香, 等. 气象要素对中国大气能见度长期变化影响的定量研究. 气候与环境研究, 2016, 21(1): 47-55. |
[8] |
中华人民共和国国家统计局. 中华人民共和国2017年国民经济和社会发展统计公报. 人民日报, 2018-03-01(10).
|
[9] |
周须文, 时青格, 贾俊妹, 等. 低能见度雾的分级预报方法研究. 热带气象学报, 2014, 30(1): 161-166. DOI:10.3969/j.issn.1004-4965.2014.01.018 |
[10] |
吴彬贵, 张建春, 李英华, 等. 天津港秋冬季低能见度数值释用预报研究. 气象, 2017, 43(7): 863-871. |
[11] |
黄政, 袁成松, 包云轩, 等. 基于不同参数化方案的高速公路大雾过程的数值模拟试验. 气象, 2016, 42(8): 944-953. |
[12] |
许爱华, 陈翔翔, 肖安, 等. 江西省区域性平流雾气象要素特征分析及预报思路. 气象, 2016, 42(3): 372-381. |
[13] |
崔广新, 李殿奎. 基于自编码算法的深度学习综述. 计算机系统应用, 2018, 27(9): 47-51. DOI:10.15888/j.cnki.csa.006542 |
[14] |
童基均, 常晓龙, 赵英杰, 等. 基于深度学习的运动目标实时识别与定位. 计算机系统应用, 2018, 27(8): 28-34. DOI:10.15888/j.cnki.csa.006525 |
[15] |
张骥, 余娟, 汪金礼, 等. 基于深度学习的输电线路外破图像识别技术. 计算机系统应用, 2018, 27(8): 176-179. DOI:10.15888/j.cnki.csa.006458 |
[16] |
许小峰. 从物理模型到智能分析——降低天气预报不确定性的新探索. 气象, 2018, 44(3): 341-350. |
[17] |
Graves A. Generating sequences with recurrent neural networks. arXiv:1308.0850, 2013.
|
[18] |
Graves A, Jaitly N. Towards end-to-end speech recognition with recurrent neural networks. Proceedings of the 31st International Conference on Machine Learning. Beijing, China. 2014. 1764–1772.
|
[19] |
Sundermeyer M, Ney H, Schlüter R. From feedforward to recurrent LSTM neural networks for language modeling. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2015, 23(3): 517-529. DOI:10.1109/TASLP.2015.2400218 |
[20] |
Graves A. Long short-term memory. Graves A. Supervised Sequence Labelling with Recurrent Neural Networks. Berlin, Heidelberg: Springer, 2012. 37–45.
|
[21] |
於雯, 周武能. 基于LSTM的商品评论情感分析. 计算机系统应用, 2018, 27(8): 159-163. DOI:10.15888/j.cnki.csa.006483 |
[22] |
史梦飞, 杨燕, 贺樑, 等. 基于Bi-LSTM和CNN并包含注意力机制的社区问答问句分类方法. 计算机系统应用, 2018, 27(9): 157-162. DOI:10.15888/j.cnki.csa.006536 |
[23] |
曹国清, 张晓明, 陈亚峰. 基于PCA-LSTM的多变量矿山排土场滑坡预警研究. 计算机系统应用, 2018, 27(11): 252-258. DOI:10.15888/j.cnki.csa.006646 |
[24] |
李胜宇, 高俊波, 许莉莉. 面向酒店评论的情感分析模型. 计算机系统应用, 2017, 26(1): 227-231. DOI:10.15888/j.cnki.csa.005511 |
[25] |
赵熙, 李京萌, 童红梅. 济南机场低能见度和低跑道视程对比分析. 干旱气象, 2017, 35(5): 847-856. |
[26] |
Abadi M, Agarwal A, Barham P, et al. TensorFlow: Large-scale machine learning on heterogeneous distributed systems. arXiv:1603.04467, 2016.
|