热带气旋(tropical cyclone, TC)是生成于热带或者副热带海洋上的低压涡旋. 热带气旋的出现不仅往往伴随着强降水和大风, 同时也可能伴随着洪水, 泥石流, 滑坡等次生灾害. 根据国家气象局统计, 每年全世界会发生80–90个气旋. 其中西北太平洋海域发生的热带气旋数量最多, 约占总气旋数的1/3[1]. 我国正是位于西北太平洋海域, 每年约有7个热带气旋登陆, 所带来的经济损失约为480亿元, 人员伤亡约为70人, 是世界上受热带气旋影响最严重的国家之一. 因此, 研究热带气旋对我国防灾减灾具有重要意义.
热带气旋强度估计是强度预报的基础性工作, 其在气象学和灾害管理领域具有重要意义. 准确估计热带气旋的强度可以提高灾害预警和应急响应的效率, 最大限度地降低人员伤亡和财产损失. 此外, 研究热带气旋强度有助于理解气候变化对热带气旋活动的影响, 为应对未来气候极端事件提供科学依据. 因此, 热带气旋强度估计的研究对于提高社会对热带气旋灾害的应对能力具有重要意义.
热带气旋强度估计是指采用各种气象数据和技术手段来确定热带气旋的强度, 通常以最大持续风速或最低海平面气压来衡量[2,3]. 根据热带气旋强度估计和预测的方法主要分为数值方法、统计方法和深度学习方法. 数值方法通过建立数理方程来描述热带气旋的演变规律. 统计方法主要依据热带气旋的统计特征来估计其强度. 深度学习方法则是基于神经网络从大量数据中提取热带气旋特征, 进而估计其强度.
数值方法虽然物理意义明确, 可解释性强, 但其存在着一些问题: 1)不同的气旋个例、不同的海域以及不同的时间尺度均会显著影响强度估计性能; 2)数值方法的性能高度依赖于精确的建模和初始化; 3)需要耗费大量的时间资源和计算资源.
统计方法则基于气旋的统计特征来估计强度, 代表方法有Dvorak系列技术、偏差方差角技术和机器学习技术等. 业务上虽然主要使用的是Dvorak技术, 但其具有较强的主观性, 准确依赖于专家的经验. 而偏角方差技术和机器学习技术依赖于热带气旋的手工特征, 随着复杂环境的变化, 可能存在着遗漏和不足.
近年来, 基于深度学习方法的热带气旋强度估计展现出了优异的性能. 不同于数值方法和统计方法, 深度学习方法具有以下优势: 1)无需手动从卫星云图中提取特征, 神经网络以数据驱动的方式可以自动地从大量数据中提取信息并拟合物理规律, 减少了对专家经验的依赖, 因此具有较强的客观性; 2)时间成本和金钱成本较低; 3)具有同时处理大批量数据的能力. 随着时间的推移, 模型学到的数据将越来越多, 强度估计能力也将越来越强. 深度学习方法主要是以一些经典的模型(如ResNet[4], VGGNet[5], Transformer[6]等)为骨架网络, 在其基础上做简单的改进后, 让网络参数从大量的数据中提取热带气旋特征, 进而估计其强度. 该类方法的本质是通过纯数据驱动的形式从大批量数据中提取物理规律, 虽然无需构建数学物理方程并且具有一定的客观性, 取得了较好的性能. 但是, 热带气旋是一个极其复杂的灾害性系统, 其受到诸多物理因素的影响, 仅从图像信息上获得的特征可能相对片面, 因此本文基于ERA-5再分析资料, 引入了多个和热带气旋强度相关的物理因子作为约束, 来辅助模型在卫星云图中的学习.
本文提出了一个融合物理信息的热带气旋强度估计模型(PF-TCIE). 通过融合物理信息来约束并辅助深度学习模型从卫星云图中获取知识. 模型主要有两个分支, 分别是多通道特征提取分支和物理信息提取分支. 多通道特征提取分支主要负责提取不同通道组合的卫星云图从而对模型估计热带气旋强度起到一定的促进作用. 物理信息提取分支则是从ERA-5因子中提取到和热带气旋强度相关的物理信息并注入多通道特征提取分支中来辅助估计热带气旋强度. 模型在西北太平洋海域上进行训练并测试, 其性能要显著优于部分传统方法和深度学习方法.
1 相关工作 1.1 数值方法数值方法基于数学物理方程来描述热带气旋的演变规律. 如全球预报系统(global forecast system, GFS)由美国国家气象局(National Weather Service, NWS)提出, 为热带气旋提供全球范围的预测和模拟, 在气象和灾害管理应用中发挥着至关重要的作用. 欧洲中期天气预报中心(European Centre for Medium Range Weather Forecasts, ECMWF)可以提供全球中纬度地区的气象预报[7]. 此外, 还有一些专门用于热带气旋研究的事件模型, 例如飓风天气研究和预报(hurricane weather research and forecasting, HWRF)[8]、地球物理流体动力学实验室模型(geophysical fluid dynamics laboratory, GFDL). 然而, 由于模拟小尺度特征困难、精度受初始值影响较大、不确定性较大、计算资源要求较高, 物理方法在应用于热带气旋时表现出一定的局限性.
1.2 基于统计的方法基于统计的热带气旋强度估计方法中最具有代表性的就是德沃夏克(Dvorak)类的方法[9–13]. 该方法假设具有相似强度的热带气旋往往会表现出相似的模式. 然而, 这种方法具有主观因素, 因为它需要气象专家从复杂的卫星图像中分析处热带气旋的结构信息, 例如眼形和风墙等. 为了缓解这个问题, Velden等人开发了客观的德沃夏克技术(objective Dvorak technique, ODT)[11], 但该方法不适用于热带低气压或弱热带气旋, 需要专家提供热带气旋中心位置. 此外, 为了估计每个热带气旋强度类别并消除人为主观性, 提出了先进的德沃夏克技术(advanced Dvorak technique, ADT)[12,13], 这是一种完全自动化的方法. 最新的ADT达到了甚至超过了相较于主观Dvorak方法的精度.
除了Dvorak方法之外, 还有一些其他方法, 例如偏差角方差技术(DAVT)[14,15]. 其原理是利用专家的经验根据卫星图像的云结构来估计热带气旋强度. 具体来讲是通过计算红外通道的亮温值的梯度来定量估算热带气旋云结构的对称程度. 通过构建热带气旋强度和结构之间的关系来估计强度. 但其会导致其准确率极大的依赖于热带气旋的中心定位信息. 此外, 当热带气旋结构信息不够明确(如遭遇了较强的风切变)时, 将会导致其结果极其不准确. 因此, 有些研究人员采用了美国国家飓风中心(National Hurricane Center, NHC)所提供的最佳路径集获取到中心定位信息作为标签, 使得这种偏角方差技术的均方根误差下降了约14%[16,17].
1.3 深度学习方法上述的一些方法大多需要大量的时间成本, 算力成本亦或是需要气象学家对于卫星云图处理的经验来估计热带气旋的强度. 近些年来, 步入了大数据时代, 人工智能(artificial intelligence, AI)随着算力的增强和数据的指数级增长而蓬勃发展, 越来越多的研究人员开始尝试使用数据驱动的深度学习模型来估计热带气旋强度[18–27]. 一些研究人员根据卷积神经网络来拟合数据并取得了较好的效果[18,19]. Chen等人[20]利用卷积神经网络并结合主动微波降水率和红外通道的亮温数据, 在世界各大海域上的平均RMSE为5.34 m/s. Zhang等人[21]通过将回归问题转化为分类问题并逐类别分析气旋强度, 最后再转为回归问题, 最终在西北太平洋海域上达到了4.93 m/s的RMSE. Zhang等人[22]通过使用了双通道(红外通道和水汽通道)的数据设计了一个双分支的卷积神经网络来估计热带气旋的强度, 在西北太平洋海域达到了5.13 m/s的RMSE. Xu等人[23]使用了ResNet作为主干网络, 采用图卷积神经网络来设计风级转换规则生成器作为先验知识, 进而注入神经网络中, 该方法在GridSat数据集上达到了5.72 m/s的RMSE. Wang等人[24]选择了葵花-8 (Himawari-8)中的4个通道, 并将其与卷积块注意力模块(convolutional block attention module, CBAM)[28]方法相结合, 验证了不同通道对卷积神经网络模型的重要性以及注意力机制的有效性, 在西北太平洋海域上测试的RMSE达到了可观的效果. Zhang等人[25]将密集连接方式应用于热带气旋强度估计中, 构建了DenseConvMixer模型. 此外, 他们还提出了一个时空编码器模块(STE-TC)来增强热带气旋图像的空间信息与时间信息. Zhuo等人[26]将气旋丰满度这一概念引入到神经网络中, 并利用多任务学习来同时估计热带气旋的强度和尺度, 该方法在GridSat数据集上取得了较好的性能. Jiang等人[27]提出了一种深度多源注意力网络(DMANet)用于多光谱红外图像的动态建模. 模型通过将信息传递增强模块与局部全局模块相结合的方式, 在多个海域上的平均RMSE达到了5.03 m/s.
2 气象数据及其预处理本文主要针对西北太平洋海域的热带气旋研究, 葵花-8提供模型的训练和测试数据, ERA-5提供物理因子, CMA最佳路径集提供标签集来指导模型训练.
2.1 葵花-8 (Himawari-8)数据集及预处理葵花-8数据集是由日本气象厅收集并处理得到的, 覆盖了整个西北太平洋海域, 包含了中国、日本在内的东亚地区和西太平洋领域. 其具体范围为90°E–180°E, 0°N–60°N. 时间分辨率为1 h, 空间分辨率为0.05°.
葵花-8数据共包含了16个通道, 分别为3个可见光通道, 3个近红外通道和10个红外通道. 每一个通道都有其对应的功能, 如检测冰雪(1.6 μm), 检测土壤植被(2.3 μm)等. 本文根据其功能选取了对判断热带气旋强度最相关的5个通道进行组合研究, 所选取的通道分别是: 3.9 μm、6.2 μm、10.4 μm、12.3 μm和13.3 μm.
为了充分考虑热带气旋的云系特征本文选取以风眼为中心, 大小范围为400×400的图片, 各通道图像的可视化如图1所示.
2.2 ERA-5数据集及预处理
本文使用由欧洲中期天气预报中心(ECMWF)提供的第5代全球大气再分析(ECMWF Reanalysis v5, ERA-5)数据[29]. 该数据基于ECMWF综合预报系统(IFS)CY41R2中的4D-Var数据同化产生, 时间范围为1979年至今, 包含了多种气象再分析要素.
本文根据文献[30]中选取了对热带气旋强度具有较强相关性的3个因子, 分别是600 hPa的相对湿度(relative humidity, RH), 200–850 hPa之间的垂直风切变(vertical wind sheer, VWS)和海平面温度(sea surface temperature, SST). 数据类型为浮点类型数据, 文件格式为NetCDF, 原始空间分辨率为0.25°, 时间分辨率为1 h.
如图2为3个物理因子的可视化, 从左至右分别是: 600 hPa高度的相对湿度, 200–850 hPa之间的垂直风切变和海平面温度. 600 hPa的相对湿度和海平面温度均可以直接从因子集中提取, 而200–850 hPa之间的垂直风切变需要通过计算得到. 具体计算过程根据式(1)–式(3)所示. 其中
$ Uwind = {U_{200{\mathrm{hPa}}}} - {U_{850{\mathrm{hPa}}}} $ | (1) |
$ Vwind = {V_{200{\mathrm{hPa}}}} - {V_{850{\mathrm{hPa}}}} $ | (2) |
$ VWS = \sqrt {Uwin{d^2} + Vwin{d^2}} $ | (3) |
中国气象局(China Meteorological Administration, CMA)的最佳路径集包含了自1949年以来西北太平洋海域上发生的热带气旋的基本信息, 包含了发生时间, 强度, 中心经纬度, 近中心最低气压以及最大持续风速等[31,32]. 其时间分辨率为6 h, 为了匹配葵花数据, 本研究对CMA最佳路径集数据进行了逐小时的线性插值.
3 融合物理信息的热带气旋强度估计网络本文提出了一种融合物理因子的热带气旋强度估计模型(physical factor fusion for tropical cyclone intensity estimation, PF-TCIE). 该模型通过将物理信息和云图特征融合入数据驱动的神经网络来辅助模型估计热带气旋的强度. 整个模型分为两部分, 如图3所示, 分别是多通道物理因子融合模块(MPFM)和深度分类回归模块(ClsR). 考虑到热带气旋是一个复杂的灾害性系统, 其形成与演化受多种物理因素的影响, 仅依赖从卫星云图提取的热带气旋强度信息可能相对片面. 因此, MPFM的独特之处在于它能够同时融合卫星云图和物理信息, 充分利用两种来源的信息以提高模型的估计性能. MPFM主要包含两个分支, 分别是多通道特征提取分支和物理信息提取分支, 用于在提取多通道信息的同时融合强度相关的物理因子信息. 此外, 热带气旋强度类别之间存在着不均衡问题, 弱气旋较多而强气旋较少. 因此, ClsR根据这一点首先将回归问题转化为深度分类问题, 然后根据统计信息设计了一个风尺度的权重矩阵, 针对不同类别分配以不同权重, 最终使得模型性能有所提高.
3.1 物理因子融合的多通道特征提取模块(MPFM)物理因子融合的多通道云图特征提取模块(multi-channel cloud image extraction module for physical factors fusion module, MPFM)由多通道特征提取分支和物理信息提取分支组成. 多通道的特征提取分支负责从多个不同波段的云系结构中提取强度信息, 而物理信息提取分支则是分别提取垂直风切变, 海平面温度和相对湿度的深层特征并将其作为约束以实现辅助模型估计气旋强度的功能.
多通道特征提取模块主要由CBAM[28]、ResNet34[4]和一些全连接层构成. CBAM模块的设计目的是从多通道的400×400大小的输入云图中提取浅层通道信息和空间信息. 具体来说, 先根据通道注意力机制学习不同波长的通道对于强度估计的重要性, 然后利用空间注意力机制从每个通道提取与气旋强度高度相关的特征区域. ResNet34作为热带气旋强度估计任务中常用的特征提取的骨干网络, 此处将其置于CBAM模块后, 其目的是先利用CBAM模块从原始的多通道卫星云图中提取到重要的浅层信息, 然后再利用ResNet34从浅层特征中进一步提取更深层的强度相关特征. 全连接层的初始阶段由256个节点构成, 其包含了模型从多通道卫星云图中提取到的强度相关信息. 通过与物理信息提取模块提取到的物理特征拼接, 实现了云图特征与物理信息的融合.
物理信息提取模块主要由卷积层、池化层、批归一化层、全连接层和Sigmoid函数构成. 由于该分支任务难度相对较低, 且考虑到训练效率, 因此对于该分支的网络设计相对简单. 首先利用卷积神经网络分别从3个物理因子中提取到与气旋强度相关的高层特征, 然后将高层特征经过批归一化、激活函数等操作后展平成一维向量, 最后将该一维向量(即物理信息特征)通过拼接操作注入云系特征中.
综上, 通过这种模型构造方式, 可以有效地利用物理信息来辅助模型从卫星云图中提取与强度相关的特征, 从而提升模型的强度估计性能.
3.2 深度细分类回归模块(ClsR)将特征提取器输出得到的深层特征输入到全连接层, 根据文献[22], 本文将全连接部分的回归问题转化为深度分类回归问题. 热带气旋在强度上存在着类别不均衡的问题[33], 如表1所示, 将热带气旋根据最大持续风速分为6类, 分别是热带低压(TD, 10.8–17.1 m/s), 热带风暴(TS, 17.2–24.4 m/s), 强热带风暴(STS, 24.5–32.6 m/s), 台风(TY, 32.7–41.4 m/s), 强台风(STY, 41.5–50.9 m/s), 超强台风(SuperTY, 51 m/s及以上). 可以发现TY和TS在西北太平洋海域总占比约55% (表1中加粗部分), 而STY和SuperTY则具有较少的占比. 本文将根据这一点设计wind scale矩阵来缓解热带气旋类别不平衡问题.
ClsR的处理流程如图4所示, 首先将全连接得到的神经元经过Softmax函数将输出变为0–1之间的logit概率分布, 得到维度为175的向量, 该向量表示对于热带气旋强度细分类后得到的每一个类别的概率. 然后将该细分类的输出logit进行Reshape操作, 将
Wind scale权重矩阵
$ \begin{split} {{V}_{w}}= & [ 10.8,10.8+\alpha ,10.8+2\alpha ,\cdots,17.1, \\ & 17.1+\beta ,17.1+2\beta ,17.1+3\beta ,\cdots,24.4, \\ & 24.4+\alpha ,24.4+2\alpha ,24.4+3\alpha ,\cdots,50.9, \\ & 50.9+\beta ,50.9+2\beta ,50.9+3\beta ,\cdots,79.9{{]}^{\rm T}} \end{split}$ | (4) |
综上, 通过ClsR中将回归任务首先转为深度分类任务, 并根据统计信息设计的风尺度权重矩阵, 可以一定程度上缓解热带气旋类别不均衡所带来的模型性能下降问题.
3.3 算法流程在训练阶段, 首先将红外通道(3.9 μm、6.2 μm、10.4 μm和12.3 μm)中的4个波段的卫星云图进行拼接(concat)操作并送入到多通道特征提取模块中, 然后分别通过CBAM中的通道注意力模块和空间注意力模块. 具体来说, 通道注意力模块部分的计算如式(5)所示, 首先将
$ {M_c}(x) = \sigma (MLP(MaxPool(x)) + MLP(AvgPool(x))) $ | (5) |
$ {M_s}(x) = \sigma (Con{v^{7 \times 7}}([MaxPool(x);AvgPool(x)])) $ | (6) |
CBAM模块的目的是让模型首先关注每个输入为
在物理信息提取模块中, 首先将3个物理因子输入到卷积神经网络中分别提取到与强度相关的信息, 将该类信息通过自适应的平均池化层首先展平为一维向量, 然后将其注入到刚得到的一维向量中, 使得原一维向量既包含卫星云图中的图像结构信息, 又包含与强度相关的物理信息. 最后经过全连接层和Softmax函数, 得到了175个关于气旋强度深度分类的神经元. 然后将其Reshape后乘以提前设定好的权重矩阵(wind scale matrix), 得到参数权值变化后的一维向量. 最后将分类再转化为回归问题得到最终的热带气旋强度估计值. 该强度值将和标签中的强度值之间计算误差, 这里通过式(7)的损失来优化整体的网络模型参数. 其中,
$ loss = \sqrt {\frac{1}{n}{{\sum\limits_{i = 1}^n {({y_i} - f({x_i}))^2} }}} $ | (7) |
本文利用葵花-8数据集, ERA-5物理因子数据集作为模型的输入, CMA最佳路径集作为标签集来指导模型的训练. 训练集为2015–2020年, 测试数据集为2021–2022年. 本研究是在NVIDIA GeForce RTX 3090服务器上进行的, 其batch size设置为32, 模型所使用的为Adam优化器和PyTorch 3.7框架, 设置的初始学习率为0.001. 所使用的损失函数为RMSE函数, 评价标准为均方根误差RMSE, 平均绝对误差MAE以及估计值与真值之间的偏差Bias.
4.2 消融实验本研究中设置了3组消融实验, 一组是验证不同通道组合的重要性; 另一组是研究了不同ERA-5的因子组合对模型的影响; 最后, 将探究引入ClsR模块对模型性能的影响.
不同波段的辐射为云层结构、气旋特征等提供多样化信息, 影响卫星云图在气旋强度估计的准确度. 若从5个波段中随机组合进行模型训练, 可产生近百种不同的组合. 为了系统化训练过程, 本文采用了一种逐步递归的训练策略. 初始阶段, 从5个波段中选出1个起始波段, 然后基于此逐步扩展其他组合. 通过将单波段的卫星云图输入同一模型并进行测试, 如表2所示, 单通道下12.3 μm波段的RMSE最优, 相比于3.9 μm提升了9.5%. 因此将12.3 μm作为起点逐步构建模型进行强度估计最合适.
然而, 红外波段虽然对热带气旋的强度估计起到了主要作用, 但水汽波段和短波红外波段对于判断热带气旋的强度也起到至关重要的作用. 如水汽通道和红外通道的亮温差可以指示对流现象的存在[34], 短波红外通道接收了一部分长波红外和太阳辐射, 增强了热力特征观测. 这些特征都是强度估计的重要线索, 因此对于水汽和短波红外通道的选取组合尤为重要.
表3中采用递归方式来测试所选的5个通道的组合. 值得注意的是, 如模型M9所示, 当13.3 μm波段与12.3 μm波段结合时, 模型精度没有提升. 因此, 在之后的研究中, 13.3 μm波段被排除在外. 经过一系列实验验证, 结合3.9 μm、6.2 μm、10.4 μm和12.3 μm这4个通道的卫星云图, 可以取得模型性能的最优效果, 相比于单通道12.3 μm提升了3.7%.
第2组消融实验是在选择的模型M12的基础上继续添加物理信息, 对比不同的ERA-5组合对模型性能的影响. 表4展示了对不同物理因子消融后, 测试得到的对应RMSE. 如M13、M14、M15所示, 通过3个因子作为辅助信息可以使未添加物理信息的神经网络的性能有所提升. 可以发现添加SST对模型性能的提升最大, 相比于不引入任何因子提升了3.1%, 而只引入VWS的提升最小. 可以得到结论: 引入SST对于模型估计热带气旋强度的辅助效果最显著, 而引入VWS所带来的收益最小. M16–M18是在给定的3个因子中任选两个并组合得到的模型, 可以发现引入SST和RH_600hPa这两个因子后的提升最明显, 其相比于仅引入单因子的M13–M15模型有大幅提升. 因此继续考虑将3个因子全部作为辅助信息来辅助M12估计热带气旋强度. M19为同时引入3个因子后的模型, 其RMSE达到了4.96 m/s. 可以发现, 相比于不引入任何因子, 性能提升了8.5%.
最后, 表4中的M20表示在M19的基础上使用ClsR模块后的整体性能, 相比于不引入该模块性能提升了2.7%.
4.3 性能比较为了验证PF-TCIE模型的性能, 将其与不同方法进行了对比, 如表5所示.
相比于统计方法如偏角方差技术DAVT, 深度学习方法要远优于此类方法. 此外, 由于WIRa-based技术是以最低海平面气压作为强度估计的指标, 因此本研究中根据联合台风预警中心(Joint Typhoon Warning Center, JTWC)所提出的风-压转换公式[36], 将最低海平面气压转为了最大持续风速并进行比较, 其RMSE和MAE分别约为9 m/s和6.4 m/s. 实验所用的大多为红外通道数据, 其中DeepMicroNet方法使用NRLTC(MINT)的微波图像来进行学习, 本文则采用红外和水汽通道进行训练和测试. PF-TCIE相比于不引入物理信息的方法如Deep-CNN、CNN-TC、DMANet、DeepMicroNet和CNN-based hybrid方法取得了更优的性能. 说明物理信息能够作为约束, 帮助网络学习热带气旋特征, 提高其强度估计性能.
4.4 误差分析为了更方便地分析不同类别下的误差, 表6展示了不同指标下各强度类别的误差分布. 指标包括模型的RMSE、MAE、Bias、高估样本量及其占总样本量的比例. 从结果中可以发现, 模型在TD和TS类别下的估计较为准确, 具有较低的RMSE和MAE.
如图5为模型估计结果和CMA的最佳路径集标签之间的对比. 图5中黑线为
此外, 本研究根据CMA强度分类标准, 各个强度类别绝对误差的箱线图分布如图6所示. 绝对误差的计算是将每一个卫星云图的模型输出结果和真值之间做差的绝对值. 从图6中可以看出随着台风强度类别的提高, 绝对误差的中位数(横线部分)也随之增加, TD和TS具有较小的中位数和较小的绝对误差分布, 说明模型对于TD和TS的强度类别的估计能力较好, 而这两个类别的数量约占总气旋类别的55%. 中位数最大的是STY和SuperTY, 其中STY有着最大的绝对误差分布范围, 说明模型对于该气旋类别的强度估计能力较差. 此外, 图6中在箱线图之外的独立的灰色散点表示不同强度类别的台风在绝对误差值上的异常值, 这说明在某些特定的台风类别中, 存在着一些绝对误差值偏离了正常的预期值.
图7展示了不同气旋强度类别的偏差分布的提琴图. 提琴图同时结合了箱线图和核密度图的特点, 不仅反映了纵坐标的值的变化范围, 也反映了纵坐标值的分布情况. 从图7中可以看出大多数强度值均处于0 m/s附近, STS、TY和STY类别的数据分布偏差范围较广, 表明在这些类别中估计的变异性较大. 而TD、TS、SuperTY类别的分布较窄, 说明模型关于这几个类别的系统偏差更小一些, 估计能力相对较好.
5 结论
本文主要针对西北太平洋海域的热带气旋强度估计, 通过物理信息和深度学习网络相融合的方式来提升模型对于热带气旋强度估计的能力. 最终根据实验得到结论. 1)选取3.9 μm、6.2 μm、10.4 μm和12.3 μm这4个波段可以有效提升模型估计热带气旋的能力, 相比于单通道性能提升了约3.7%. 2)随着海平面温度, 200–850 hPa之间的垂直风切变和600 hPa的相对湿度这3个物理因子的同时引入, 模型性能相比于不引入物理因子时有8.5%的提升, 说明物理因子的引入可以有效辅助深度学习模型拟合复杂的热带气旋系统. 通过一系列实验结果的可视化分析了不同类别的误差分布. 实验结果表明该方法可以有效地估计西北太平洋海域的热带气旋强度, 误差仅为4.83 m/s.
[1] |
Woo WC, Wong WK. Operational application of optical flow techniques to radar-based rainfall nowcasting. Atmosphere, 2017, 8(3): 48. DOI:10.3390/atmos8030048 |
[2] |
Wang Y, Wu CC. Current understanding of tropical cyclone structure and intensity changes—A review. Meteorology and Atmospheric Physics, 2004, 87(4): 257-278. DOI:10.1007/s00703-003-0055-6 |
[3] |
Zhuge XY, Guan J, Yu F, et al. A new satellite-based indicator for estimation of the western North Pacific tropical cyclone current intensity. IEEE Transactions on Geoscience and Remote Sensing, 2015, 53(10): 5661-5676. DOI:10.1109/TGRS.2015.2427035 |
[4] |
He KM, Zhang XY, Ren SQ, et al. Deep residual learning for image recognition. Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas: IEEE, 2016. 770–778.
|
[5] |
Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition. Proceedings of the 3rd International Conference on Learning Representations. San Diego: ICLR, 2015.
|
[6] |
Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need. Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach: ACM, 2017. 6000–6010.
|
[7] |
Molinari J, Vollaro D, Robasky F. Use of ECMWF operational analyses for studies of the tropical cyclone environment. Meteorology and Atmospheric Physics, 1992, 47(2): 127-144. |
[8] |
Tallapragada V, Bernardet L, Biswas MK, et al. Hurricane weather research and forecasting (HWRF) model: 2013 scientific documentation. Technical Report, Developmental Testbed Center, 2014.
|
[9] |
Dvorak VF. A technique for the analysis and forecasting of tropical cyclone intensities from satellite pictures. NOAA Technical Memorandum NESS, 1973.
|
[10] |
Dvorak VF. Tropical cyclone intensity analysis and forecasting from satellite imagery. Monthly Weather Review, 1975, 103(5): 420-430. DOI:10.1175/1520-0493(1975)103<0420:TCIAAF>2.0.CO;2 |
[11] |
Velden CS, Olander TL, Zehr RM. Development of an objective scheme to estimate tropical cyclone intensity from digital geostationary satellite infrared imagery. Weather and Forecasting, 1998, 13(1): 172-186. DOI:10.1175/1520-0434(1998)013<0172:DOAOST>2.0.CO;2 |
[12] |
Olander TL, Velden CS. The advanced Dvorak technique: Continued development of an objective scheme to estimate tropical cyclone intensity using geostationary infrared satellite imagery. Weather and Forecasting, 2007, 22(2): 287-298. DOI:10.1175/WAF975.1 |
[13] |
Olander TL, Velden CS. The advanced Dvorak technique (ADT) for estimating tropical cyclone intensity: Update and new capabilities. Weather and Forecasting, 2019, 34(4): 905-922. DOI:10.1175/WAF-D-19-0007.1 |
[14] |
Piñeros MF, Ritchie EA, Tyo JS. Estimating tropical cyclone intensity from infrared image data. Weather and Forecasting, 2011, 26(5): 690-698. DOI:10.1175/WAF-D-10-05062.1 |
[15] |
Piñeros MF, Ritchie EA, Tyo JS. Objective measures of tropical cyclone structure and intensity change from remotely sensed infrared image data. IEEE Transactions on Geoscience and Remote sensing, 2008, 46(11): 3574-3580. DOI:10.1109/TGRS.2008.2000819 |
[16] |
Ritchie EA, Valliere-Kelley G, Piñeros MF, et al. Tropical cyclone intensity estimation in the North Atlantic basin using an improved deviation angle variance technique. Weather and Forecasting, 2012, 27(5): 1264-1277. DOI:10.1175/WAF-D-11-00156.1 |
[17] |
Ritchie EA, Wood KM, Rodríguez-Herrera OG, et al. Satellite-derived tropical cyclone intensity in the North Pacific Ocean using the deviation-angle variance technique. Weather and Forecasting, 2014, 29(3): 505-516. DOI:10.1175/WAF-D-13-00133.1 |
[18] |
Pradhan R, Aygun RS, Maskey M, et al. Tropical cyclone intensity estimation using a deep convolutional neural network. IEEE Transactions on Image Processing, 2018, 27(2): 692-702. DOI:10.1109/TIP.2017.2766358 |
[19] |
Tian W, Huang W, Yi L, et al. A CNN-based hybrid model for tropical cyclone intensity estimation in meteorological industry. IEEE Access, 2020, 8: 59158-59168. DOI:10.1109/ACCESS.2020.2982772 |
[20] |
Chen BF, Chen B, Lin HT, et al. Estimating tropical cyclone intensity by satellite imagery utilizing convolutional neural networks. Weather and Forecasting, 2019, 34(2): 447-465. DOI:10.1175/WAF-D-18-0136.1 |
[21] |
Zhang CJ, Wang XJ, Ma LM, et al. Tropical cyclone intensity classification and estimation using infrared satellite images with deep learning. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2021, 14: 2070-2086. DOI:10.1109/JSTARS.2021.3050767 |
[22] |
Zhang R, Liu QS, Hang RL. Tropical cyclone intensity estimation using two-branch convolutional neural network from infrared and water vapor images. IEEE Transactions on Geoscience and Remote Sensing, 2020, 58(1): 586-597. DOI:10.1109/TGRS.2019.2938204 |
[23] |
Xu GN, Li Y, Ma C, et al. TFG-Net: Tropical cyclone intensity estimation from a fine-grained perspective with the graph convolution neural network. Engineering Applications of Artificial Intelligence, 2023, 118: 105673. DOI:10.1016/j.engappai.2022.105673 |
[24] |
Wang C, Zheng G, Li XF, et al. Tropical cyclone intensity estimation from geostationary satellite imagery using deep convolutional neural networks. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 4101416. |
[25] |
Zhang Z, Yang XY, Wang X, et al. A neural network with spatiotemporal encoding module for tropical cyclone intensity estimation from infrared satellite image. Knowledge-based Systems, 2022, 258: 110005. DOI:10.1016/j.knosys.2022.110005 |
[26] |
Zhuo JY, Tan ZM. Physics-augmented deep learning to improve tropical cyclone intensity and size estimation from satellite imagery. Monthly Weather Review, 2021, 149(7): 2097-2113. |
[27] |
Jiang WJ, Hu G, Wu TT, et al. DMANet_KF: Tropical cyclone intensity estimation based on deep learning and Kalman filter from multispectral infrared images. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2023, 16: 4469-4483. DOI:10.1109/JSTARS.2023.3273232 |
[28] |
Woo S, Park J, Lee JY, et al. CBAM: Convolutional block attention module. Proceedings of the 15th European Conference on Computer Vision (ECCV). Munich: Springer, 2018. 3–19.
|
[29] |
Hersbach H, Bell B, Berrisford P, et al. The ERA5 global reanalysis. Quarterly Journal of the Royal Meteorological Society, 2020, 146(730): 1999-2049. DOI:10.1002/qj.3803 |
[30] |
Bhatia K, Baker A, Yang WC, et al. A potential explanation for the global increase in tropical cyclone rapid intensification. Nature Communications, 2022, 13(1): 6626. DOI:10.1038/s41467-022-34321-6 |
[31] |
Ying M, Zhang W, Yu H, et al. An overview of the China meteorological administration tropical cyclone database. Journal of Atmospheric and Oceanic Technology, 2014, 31(2): 287-301. DOI:10.1175/JTECH-D-12-00119.1 |
[32] |
Lu XQ, Yu H, Ying M, et al. Western North Pacific tropical cyclone database created by the China Meteorological Administration. Advances in Atmospheric Sciences, 2021, 38(4): 690-699. DOI:10.1007/s00376-020-0211-7 |
[33] |
Zhou YC, Zhan RF, Wang YQ, et al. Characteristics and controlling factors of rapid weakening of tropical cyclones after reaching their intensity peaks over the western North Pacific. Journal of Geophysical Research: Atmospheres, 2022, 127(21): e2022JD036697. DOI:10.1029/2022JD036697 |
[34] |
Olander TL, Velden CS. Tropical cyclone convection and intensity analysis using differenced infrared and water vapor imagery. Weather and Forecasting, 2009, 24(6): 1558-1572. DOI:10.1175/2009WAF2222284.1 |
[35] |
Wimmers A, Velden C, Cossuth JH. Using deep learning to estimate tropical cyclone intensity from satellite passive microwave imagery. Monthly Weather Review, 2019, 147(6): 2261-2282. DOI:10.1175/MWR-D-18-0391.1 |
[36] |
Atkinson GD, Holliday CR. Tropical cyclone minimum sea level pressure/maximum sustained wind relationship for the western North Pacific. Monthly Weather Review, 1977, 105(4): 421-427. DOI:10.1175/1520-0493(1977)105<0421:TCMSLP>2.0.CO;2 |