计算机系统应用  2024, Vol. 33 Issue (8): 123-131   PDF    
融合多源数据的深度学习短时降水预测
夏景明1, 戴如晨1, 谈玲2     
1. 南京信息工程大学 人工智能学院, 南京 210044;
2. 南京信息工程大学 计算机学院, 南京 210044
摘要:针对传统降水预测方法的局限性, 提出了一种融合多源数据的深度学习短时降水预测模型MSF-Net. 在GPM历史降水数据的基础上融合了ERA5气象数据、雷达数据和DEM数据. 利用气象特征提取模块学习多源数据的气象特征, 通过注意力融合预测模块进行特征融合并实现短时降水预测. 将MSF-Net的降水预测结果与多种人工智能方法进行对比, 实验结果表明, MSF-Net模型的风险评分TS和偏差评分Bias最优, 表明其可以在6 h的预测时效内提升数据驱动降水预测的效果.
关键词: 深度学习    短时降水预测    注意力机制    数据融合    数据驱动    
Deep Learning for Short-term Precipitation Prediction Integrating Multi-source Data
XIA Jing-Ming1, DAI Ru-Chen1, TAN Ling2     
1. School of Artificial Intelligence, Nanjing University of Information Science and Technology, Nanjing 210044, China;
2. School of Computer Science, Nanjing University of Information Science and Technology, Nanjing 210044, China
Abstract: This study proposes a deep learning model for short-term precipitation forecasting, called MSF-Net, to address the limitations of traditional methods. This model integrates multi-source data, including GPM historical precipitation data, ERA5 meteorological data, radar data, and DEM data. A meteorological feature extraction module is employed to learn the meteorological features of the multi-source data. An attention fusion prediction module is used to achieve feature fusion and short-term precipitation forecasting. The precipitation forecasting results of MSF-Net are compared with those of various artificial intelligence methods. Experimental results indicate that MSF-Net achieves optimal threat score (TS) and bias score (Bias). This suggests that it can enhance the effectiveness of data-driven precipitation forecasting within a 6 h prediction horizon.
Key words: deep learning     short-term precipitation prediction     attention mechanism     data fusion     data-driven    

短时降水的预测在实时决策、生产规划和自然灾害预警等方面发挥着至关重要的作用[1]. 传统的雷达回波外推法[2]对回波数据的质量要求较高, 并且易受到多种因素干扰. 人工智能的兴起为数值预报的发展提供了新机遇[3]. 深度学习作为强大的数据处理工具, 能够从数据中自动学习有效的特征. 基于深度学习的数据驱动方法相对于传统方法, 能够更好地预测具有非线性特征的降水[4]. 为捕捉数据的时序信息, Ravuri等[5]基于CGAN从雷达数据中学习降水的时空动态特征, 提高了临近降水预测的准确性. Agrawal等[6]利用ConvLSTM进行降水预测, 提升了未来1 h的预测准确率, 但在中长期时间尺度上表现欠佳. 针对此问题, de Ruiter等[7]利用CNN将全球低分辨率与区域高分辨率天气模型的降水预测结果融合, 改善了中期降水预测的效果. 针对深度学习对强降水预测能力不佳的问题[8], Singh等[9]通过残差学习有效地捕捉了降水与气象因素之间复杂的非线性关系, 提高了对大量级降水的预测效果. 为了进一步提高预测效果, 一些研究采用多种气象数据的融合策略[10], 相对于使用单一数据, 表现更佳[11]. 如MetNet[12]利用自注意力机制融合雷达和卫星数据, 对8 h降水预测准确性超过了传统数值天气预报. Assiri等[13]利用随机森林回归模型融合了卫星和观测数据, 提高了预测准确性. Schaumann等[14]利用神经网络将雷达和数值预报数据融合, 生成多个阈值的降水预测, 但其未考虑其他降水生成因素的影响, 无法捕捉复杂的强对流天气现象[15].

1 资料介绍 1.1 研究区域

本文选取地理范围(97°–106.6°E, 20.4°–30°N)作为研究区域, 主要涵盖了云南、四川和贵州等地区. 该区域地势复杂且高原较多, 因此我们的降水预测具有较大的挑战性. 实验使用2018–2020年的数据作为训练集和测试集, 2021–2022年的数据作为验证集.

1.2 数据来源

本文所用的资料包括: (1)全球卫星降水计划GPM, 包含时间分辨率为0.5 h, 空间分辨率为0.1°×0.1°的累积降水格点数据集. (2)欧洲中期天气预报中心(ECMWF)的全球ERA5气象再分析数据, 时间分辨率为1 h, 空间分辨率为0.1°×0.1°. 本文在何萍等[16]得出的影响降水的气象要素基础上加以扩充, 如表1所示. (3) ASTGTM数字高程模型DEM数据, 可以从中获得地球表面的详细形状和纹理等细节, 本文使用其中的坡度、梯度、流域和地形起伏度4种数据, 空间分辨率为0.03°×0.03°. (4) 国家气象科学数据中心的雷达组网基本反射率合成图, 空间分辨率为0.01°×0.01°.

1.3 数据预处理

由于ERA5数据、雷达数据和DEM数据的空间分辨率不同, 使用双线性插值将它们的分辨率处理至0.1°×0.1°. 为了避免不同数据的数量级差别过大, 对所有数据进行线性归一化处理后输入模型.

表 1 ERA5气象要素选取及介绍

2 研究方法 2.1 MSF-Net网络整体架构

为了实现短时降水的有效预测, 本文在SimVP[17]的基础上改进, 结合卷积神经网络的优势, 设计了一种短时降水预测网络MSF-Net, 如图1所示. MSF-Net是一个多输入单输出的预测网络, 输入为起报时刻前12 h的逐小时GPM累积降水量数据、整点的ERA5气象数据、整点的雷达数据和DEM数据, 输出为起报时刻后6 h的逐小时累积降水量预测. MSF-Net网络包含两个子模块, 分别是气象特征提取模块ME-SimVP和注意力融合预测模块AFPM. 经过AFPM模块后, 输出6 h短时降水的预测结果.

2.2 模型输入

通过分析过去一段时间的降水数据, 可以推测未来的降水模式和趋势, 而气象要素也与降水密切相关. 因此, 本文将GPM历史降水数据、雷达基本反射率图与ERA5气象数据相结合, 并融合DEM数据. 以时间序列的方式将以上数据输入深度学习模型, 输入数据的维度为$ {{T}} \times {{C}} \times {{W}} \times {{H}} $, T代表起报时刻t之前的T 小时, C代表气象数据的通道数、WH分别代表研究区域的格点宽度和高度. 输出数据的维度为${{T'}} \times {{W}} \times {{H}}$, T'为起报时刻t之后的T'小时. 具体使用起报时刻t之前12 h的逐小时数据进行训练, 将起报时刻t之后6 h的逐小时GPM累积降水量作为训练标签, 以获得模型对未来6 h的降水预测能力.

2.3 气象特征提取模块

降水预测本质上可以视为时间序列的预测问题. 基于CNN框架的SimVP是一种简单的时空预测模型, 其只使用了简单的卷积神经网络, 无法有效地处理复杂的时空关系. 本文的ME-SimVP网络着重于气象数据时空特征的提取, 所以相对于SimVP模型, 减少了编码器和解码器的层数, 从而减少网络的冗余. 本节首先介绍气象特征提取模块的整体框架, 如图2所示. ME-SimVP主要由3个部分组成: 编码器、转换器和解码器. 为了增加多源数据的特征复用, 将编码器与解码器之间的每一层进行前后特征相加.

图 1 MSF-Net短时降水预测网络示意图

图 2 气象特征提取模块(ME-SimVP)

编码器用于提取输入数据的时空特征, 由1×1的卷积和下采样实现, 将输入数据的TC两个维度相乘合并, 使输入变成一个三维特征图, 其维度为(T×CW×H, 其步骤为:

$ F_1 = ReLU\left( {Norm\left( {Conv_{1 \times 1}\left( {F_0} \right)} \right)} \right) $ (1)

其中, $F_0$表示编码器的输入, 在本文中对应t–11时刻至t时刻的GPM降水数据、雷达数据和ERA5气象数据, $ F_1 $是编码器的输出特征图. $ReLU$表示非线性激活, $Norm$表示归一化. 解码器利用获得的时空信息重构特征图大小, 由1×1的卷积和上采样实现. 其步骤为:

$ \begin{split} \\[-10pt] F_3 = Add\left[ {F_0^j, ReLU\left( {Norm\left( {unConv_{1 \times 1}\left( {F_2} \right)} \right)} \right)} \right], 1 \leqslant j \leqslant 2 \end{split} $ (2)

其中, $F_0^j$表示编码器中与解码器相加的对应特征图, $F_2$是解码器中输入的特征图.

基于本文的气象特征提取场景对SimVP的转换器进行改进, 由多个连续的DC块构成, 如图3所示. 在大气演变过程中, 每个网格的降水情况会受到周围的气象要素的影响, 因此在DC块中首先使用不同大小的深度可分离卷积捕获特征变化. 采用LN[18]来使训练过程更加平稳, 与BN不同, LN在每层对单个样本的所有神经元节点进行规范化, 更加适合处理本文中复杂的气象数据. 随着时间推移, 一些气象要素会在空间上产生移动和变化, 使用通道卷积提取它们的时空变化信息和更高语义的特征. 将每个DC块的输入与输出之间建立残差连接, 使模型更容易地学习到低频和高频气象特征, 提升对不同量级降水的预测能力.

图 3 转换器中的DC块

2.4 注意力融合预测模块

本文设计了一个注意力融合预测模块AFPM, 如图4所示. AFPM由双通道注意力(dual channel attention network, DCA-Net)和融合预测模块组成, 实现对降水气象特征的充分提取和多源数据间的信息交互. 注意力融合预测模块的步骤为:

$ F{'}=Add\left[F_3\cdot DCA(Add(F_3, F_4)), F_4\cdot DCA(Add(F_3, F_4))\right]$ (3)

其中, $F'$表示注意力融合预测模块的输出, $F_3$$F_4$分别表示ME-SimVP输出和DEM数据, 经DCA-Net模块后分别与原始输入逐元素相乘.

图 4 注意力融合预测模块(AFPM)

接下来详细介绍双通道注意力DCA-Net的实现方法, 如图5所示. 该模块将ME-SimVP输出特征图与DEM数据进行融合, 融合后的特征图既包含与降水有关的气象信息, 又考虑了地形对降水形成与分布的影响.

(1)通道注意力: 首先将输入特征图经过两个步长不同的卷积, 捕获不同尺度的气象和地形特征. 接着对融合后的特征图使用全局平均池化进行空间压缩, 减少对位置信息的依赖. 然后使用逐点卷积学习通道特征, 减少冗余参数并提高模型的泛化能力.

(2)空间注意力: 首先对输入特征图在通道上全局平均池化和最大池化, 保留特征图的背景信息并突出影响降水的特征. 由于气象数据的信息量较大, 采用扩张因子不同的空洞卷积, 在不同感受野上提取气象特征. 经过空间注意力处理后, 模型增强了感兴趣区域的特征响应, 更好地学习到降水的变化趋势.

图 5 双通道注意力(DCA-Net)

3 实验分析 3.1 实验方案 3.1.1 评价指标

为了验证MSF-Net模型的降水预测效果, 计算研究区域内所有格点预测结果的风险评分(threat score, TS)和偏差评分(bias score, Bias), 作为本文的评价指标, 对模型的性能进行评估, 训练时使用多分类任务常用的交叉熵损失函数. 将降水量分为6个等级, 如表2所示.

表 2 降水量分级

TSBias的计算公式分别如下所示:

$ TS = \frac{{\displaystyle\sum\limits_{i = 1}^6 {TP(k)} }}{{\displaystyle\sum\limits_{i = 1}^6 {TP(k) + FP(k) + FN(k)} }} $ (4)
$ Bias = \frac{{\displaystyle\sum\limits_{i = 1}^6 {TP(k)} + FP(k)}}{{\displaystyle\sum\limits_{i = 1}^6 {TP(k)} + FN(k)}} $ (5)

其中, k表示降水量的6个等级, TP表示预测格点中真实有雨并且雨量等级预报正确的次数, FN表示真实有雨但预测为无雨或预测为有雨但雨量等级预测错误的次数, FP表示真实无雨但预测为有雨的次数. 通过统计TP、FN和FP, 将各级雨量预测结果相加并计算得到TSBias作为实验评价指标. TS评分越高, 表示模型的降水预测性能越好; Bias评分越接近1, 表示模型的预测结果与实际观测的偏差越小.

3.1.2 实验步骤

本文实验均以研究区域内相应时间的GPM降水实况数据为基准(label), 分为以下3个步骤实施.

(1) 消融实验方案

为了验证ME-SimVP模块和多源数据融合AFPM方案对短时降水预测效果的有效提升, 拟对上述方法开展消融实验. 在SimVP网络中依次加入ERA5数据(ERA5方案)、雷达数据(ERA5-Radar方案)、DEM数据(ERA5-Radar-DEM方案)、ME-SimVP模块(ERA5-Radar-DEM-ME方案)和AFPM模块(ERA5-Radar-DEM-ME-AFPM方案).

(2) 对比实验方案

为了验证MSF-Net降水预测模型的性能, 将MSF-Net的预测结果与WRF物理预测结果、U-Net[19]预测结果、ConvLSTM预测结果和N-BEATS[20]预测结果进行对比.

(3) 时效实验与量级实验方案

为了验证MSF-Net降水预测模型的时效和量级预测性能, 在(t+1) h至(t+6) h的时间尺度上进行实验, 分析不同模型在不同时效下的降水预测性能, 以及MSF-Net对不同量级降水的预测性能.

3.2 消融实验

根据消融实验方案进行实验, 对比了不同降水预测方案的TSBias评价指标. 以方案名的首字母来表示每种方法, 由于GPM降水数据在每个方法中均有使用, 在表3中省略.

表 3 MSF-Net模型降水预测消融实验结果

表3中可以看出, 将ERA5数据加入到SimVP网络中(E方案)相比原始SimVP模型, TS提升了0.03, Bias提升了0.05, 这是因为可以从气象要素中提取到湿度、温差等影响降水的大气信息; 雷达图不仅可以反映当前降水的强度和分布情况, 还能显示降水粒子的运动方向, 相比E方案, E-R方案的TSBias分别提升了0.04和0.06; DEM数据通过地形的高低变化等信息, 影响降水的凝结和补给, 将DEM数据加入到E-R方案中(E-R-D方案), TS提升了0.02, Bias提升了0.04; 将SimVP替换为ME-SimVP后, E-R-D-M方案相比E-R-D方案, TSBias分别提升了0.03和0.04, 这是因为ME-SimVP使用不同的空洞卷积来捕获特征变化, 在减少参数量的情况下更好地提取不同感受野的气象时空信息. 同时, 在DC块之间建立残差连接, 提高了网络预测性能; 将AFPM加入到E-R-D-M方案中(E-R-D-M-A方案), TS提升了0.04, Bias提升了0.03, AFPM具有双通道注意力机制和融合结构, 可以根据需求自适应地赋予降水相关性强的气象特征更高权重, 并且有效地融合DEM数据, 考虑地形对降水形成与分布的影响.

图6展示了2021年6月19日12–14时研究区域内消融实验的预测结果示例. 从图6中可以观察到, 在SimVP网络的基础上加入了ERA5数据、雷达数据和DEM数据后, 模型对降水区域的预测更加准确, 一些稀疏的小雨被预测出来, 并在T+1时刻预测出一部分暴雨. 继续加入ME-SimVP和AFPM模块后, 模型的预测效果更加接近GPM降水实况数据, 提升了对大雨和暴雨的预测性能, 并且成功预测出了大暴雨量级的降水.

图 6 2021年6月19日12–14时的消融结果示例

3.3 对比实验

按照对比实验方案进行实验. 从表4中可以看出, MSF-Net网络预测效果最佳, 相较于WRF物理模型、U-Net、ConvLSTM和N-BRATS预测结果, TS分别高了0.24、0.18、0.12和0.09.

图7展示了2021年7月17日15时不同模型的降水预测结果对比. 从图7中整体可以看出, MSF-Net的预测效果与GPM降水实况接近, 优于其他几种方法. 相较于其他模型, MSF-Net对小雨的误报相对较少. 在暴雨以上量级的降水上, MSF-Net的预测能力明显优于其他方法, 并且成功预测出一部分特大暴雨.

表 4 不同模型的降水预测对比实验结果

图 7 2022年7月17日15时的对比实验示例

3.4 时效实验和量级实验

为了评估MSF-Net模型的时效性, 我们比较了2021年6–8月各模型在不同时效(1–6 h)预测结果的变化情况, 评价指标采用TS. 从图8可以看出, 所有模型在时效变长后性能均有所下降, 但MSF-Net在各时段的预测效果均优于其他方法, 且模型的性能下降较为缓慢. 在1 h时刻MSF-Net模型预测性能的领先幅度较大, TS比WRF预报高约0.23, 主要得益于MSF-Net模型中融入了雷达图, 从而提升短时间内的降水预测效果. MSF-Net在5–6 h时刻的领先幅度有所缩小, 但仍比ConvLSTM高约0.06.

图 8 2021年不同模型的时效实验结果

图9展示了2021年8月12日13–18时MSF-Net模型的降水预测效果示例. 从图9中可以看出, MSF-Net在T+1时刻和T+2时刻的预测性能最好. T+3时刻由于中雨分布较为分散, 模型预测性能有所下降. T+4时刻和T+5时刻模型的预测效果接近, 均成功预测到了暴雨和大暴雨区域. T+6时刻模型对边缘地区的小雨预测存在部分偏差, 但整体预测结果与GPM降水实况接近.

我们对MSF-Net在不同量级降水上的预测性能进行分析, 实验结果如表5所示. 从表5中可以看出, 小雨和中雨由于时空尺度相对较小, 因此它们的演变更容易被模型捕捉, TS分别为0.73和0.71, Bias为1.04和1.05. 暴雨通常伴随着复杂的大气环境和强烈的对流活动, 这些变化相对难以准确模拟, 因此预测效果不如小雨和中雨. 对于暴雨以上量级的降水, 虽然预测效果有所下降, 但MSF-Net仍表现出一定的优势.

4 贡献与结论

本文提出了一种基于深度学习的短时降水预测模型MSF-Net. 有效地融合多源气象数据, 能够对未来6 h的逐小时累积降水进行预测, 为降水预测领域的发展提供了新的思路. 本文的主要贡献如下.

(1)提出了一种融合多源数据的短时降水预测网络MSF-Net. 网络由气象特征提取模块和注意力融合预测模块构成. 考虑到多源数据中影响降水的复杂气象信息, 构建了一个多输入单输出的深度学习模型.

(2)提出了一种气象特征提取方法, 针对不同特性和空间分辨率的气象数据, 设计了气象特征提取模块ME-SimVP, 减少在特征提取过程中出现的信息丢失.

图 9 2021年8月12日13–18时的时效实验示例

表 5 MSF-Net对不同量级降水预测的实验结果

(3)设计了一种注意力融合预测模块AFPM, 将ME-Net输出与DEM数据的深层次气象特征融合, 考虑地形对降水形成与分布的影响, 进一步提升预测效果.

结合多种实验方案及评估分析得到以下结论.

(1) 相比其他几种深度学习方法, MSF-Net网络对降水雨区分布的预测效果更加优秀, 这是由于ME-SimVP能够捕获多源数据中的局部与全局气象特征, 并实现气象信息的特征复用; 在预测网络中添加AFPM模块, 使模型关注降水特征明显的区域, 通过双通道注意力机制学习深层次特征, 提升模型对不同量级降水的预测能力.

(2) 消融实验中添加了ERA5气象数据, 表明模型可以从中获取影响降水的气象要素; ERA5-Radar方案融合了雷达数据, 体现出当前降水区域及降水粒子的走势, 使模型更好地预测未来一段时间的降水情况; ERA5-Radar-DEM方案表明地形会对降水的形成与分布产生影响. 由此可见多源数据的添加使模型的性能有所提升.

(3) 在时效性和量级实验中, MSF-Net网络的预测性能在6 h内的每个时段均领先于其他几种方法, 其对不同量级的降水预测都表现出较好的效果, 并且随着时间的推移, 模型的预测性能相对稳定. 表明MSF-Net网络对短时降水的预测能力较强且具有较好的鲁棒性.

参考文献
[1]
李皓轩, 梅松军, 周康, 等. 降雨短时临近预报技术研究进展. 中国防汛抗旱, 2023, 33(5): 19-22. DOI:10.16867/j.issn.1673-9264.2023179
[2]
黄兴友, 马玉蓉, 胡苏蔓. 基于深度学习的天气雷达回波序列外推及效果分析. 气象学报, 2021, 79(5): 817-827. DOI:10.11676/qxxb2021.041
[3]
Vannitsem S, Bremnes JB, Demaeyer J, et al. Statistical postprocessing for weather forecasts: Review, challenges, and avenues in a big data world. Bulletin of the American Meteorological Society, 2021, 102(3): E681-E699. DOI:10.1175/BAMS-D-19-0308.1
[4]
Ayzel G, Scheffer T, Heistermann M. RainNet v1.0: A convolutional neural network for radar-based precipitation nowcasting. Geoscientific Model Development, 2020, 13(6): 2631-2644. DOI:10.5194/gmd-13-2631-2020
[5]
Ravuri S, Lenc K, Willson M, et al. Skilful precipitation nowcasting using deep generative models of radar. Nature, 2021, 597(7878): 672-677. DOI:10.1038/s41586-021-03854-z
[6]
Agrawal S, Barrington L, Bromberg C, et al. Machine learning for precipitation nowcasting from radar images. Proceedings of the 33rd Conference on Neural Information Processing Systems. Vancouver, 2019.
[7]
de Ruiter B. Post-processing multi-model medium-term precipitation forecasts using convolutional neural networks. arXiv:2105.07043, 2021
[8]
袁凯, 庞晶, 李武阶, 等. 深度学习模型对武汉地区雷达回波临近预报的检验评估. 暴雨灾害, 2022, 41(4): 458-466. DOI:10.3969/j.issn.1004-9045.2022.04.010
[9]
Singh M, Kumar B, Rao S, et al. Deep learning for improved global precipitation in numerical weather prediction systems. arXiv:2106.12045, 2021.
[10]
师春香, 潘旸, 谷军霞, 等. 多源气象数据融合格点实况产品研制进展. 气象学报, 2019, 77(4): 774–783.
师春香, 潘旸, 谷军霞, 等. 多源气象数据融合格点实况产品研制进展. 气象学报, 2019, 77(4): 774–783.
[11]
潘旸, 谷军霞, 徐宾, 等. 多源降水数据融合研究及应用进展. 气象科技进展, 2018, 8(1): 143-152. DOI:10.3969/j.issn.2095-1973.2018.01.019
[12]
Sønderby CK, Espeholt L, Heek J, et al. MetNet: A neural weather model for precipitation forecasting. arXiv:2003.12140, 2020.
[13]
Assiri ME, Qureshi S. A multi-source data fusion method to improve the accuracy of precipitation products: A machine learning algorithm. Remote Sensing, 2022, 14(24): 6389. DOI:10.3390/rs14246389
[14]
Schaumann P, Hess R, Rempel M, et al. A calibrated and consistent combination of probabilistic forecasts for the exceedance of several precipitation thresholds using neural networks. Weather and Forecasting, 2021, 36(3): 1079-1096. DOI:10.1175/WAF-D-20-0188.1
[15]
Chen X, Zhuge XY, Zhang XD, et al. Objective identification and climatic characteristics of heavy-precipitation northeastern China cold vortexes. Advances in Atmospheric Sciences, 2023, 40(2): 305-316. DOI:10.1007/s00376-022-2037-y
[16]
何萍, 李矜霄, 付永梅, 等. 滇中城市降水特征及其成因分析. 北京大学学报(自然科学版), 2019, 55(4): 626-634. DOI:10.13209/j.0479-8023.2019.040
[17]
Tan C, Gao ZY, Li SY, et al. SimVP: Towards simple yet powerful spatiotemporal predictive learning. arXiv:2211.12509, 2022.
[18]
Ba JL, Kiros JR, Hinton GE. Layer normalization. arXiv:1607.06450, 2016.
[19]
Ronneberger O, Fischer P, Brox T. U-Net: Convolutional networks for biomedical image segmentation. Proceedings of the 18th International Conference on Medical Image Computing and Computer-assisted Intervention. Munich: Springer, 2015. 234–241. [doi: 10.1007/978-3-319-24574-4_28]
[20]
Oreshkin BN, Carpov D, Chapados N, et al. N-BEATS: Neural basis expansion analysis for interpretable time series forecasting. Proceedings of the 8th International Conference on Learning Representations. Addis Ababa: OpenReview.net, 2020.