基于深度学习的天气预测模型的研究
Research on deep learning-based weather prediction model.
由于对全球人类生活的影响,天气预报引起了来自各个研究领域的研究人员的兴趣。许多研究受到深度学习技术的最新发展、大量天气数据集的广泛可用性以及信息和计算机技术的出现的推动,探索隐藏在大量天气数据集中的层次模式,用于天气预报。机器学习技术已被应用于预测极端天气事件,识别观测和模拟大气条件中的极端天气和气候模式,并为严重天气提供操作指导和风险评估。过去几年中,已经开发出了基于深度学习的天气预测模型,如MetNet-2、WF-UNet、ClimaX、GraphCast、Pangu-Weather等。本文简要介绍这些模型,以便深入了解这些模型如何迅速击败传统的气象模拟器。
ClimaX:天气和气候的基础模型
以物理学为基础的数值大气模型是当今天气和气候预报软件的基础。这些技术模拟了非线性动力学和复杂的多变量相互作用,使得近似它们变得具有挑战性。以高空间和时间分辨率数值模拟大气过程在计算上是具有挑战性的。最新的基于机器学习的数据驱动技术直接通过在深度神经网络中训练数据驱动的函数映射来处理下游预测或投影任务。由于它们仅在有限和一致的气候数据上进行训练,这些网络缺乏数值模型的普适性,不能处理离散的时空任务。
由Microsoft Autonomous Systems and Robotics Research、Microsoft Research AI4Science和UCLA的新研究提出了ClimaX,这是一个用于天气和气候科学的深度学习模型,可以在不同的数据集、不同的变量、空间和时间覆盖范围以及物理基础上进行训练。ClimaX使用CMIP6气候数据集进行无监督训练。为了增加计算量而保持广泛适用性,ClimaX扩展了Transformer与新颖的编码和聚合块。
在初始训练之后,ClimaX可以进行微调,以执行各种气候和天气任务,包括涉及大气变量和不同时间和空间尺度的任务。即使在较低分辨率和较少计算预算下预训练,ClimaX的普适性也使其能够在天气预报和气候预测基准测试中胜过数据驱动的基线。
研究人员认为,这种方法的普适性可能使其在更多不同的目的中发挥作用。这可能包括预测极端天气事件和评估人为气候变化,这两个例子都是可以受益于已经进行预训练的ClimaX骨干的地球系统科学任务。农业、人口统计学和精算学也是有趣的候选领域,因为它们与天气和气候密切相关。
Pangu-Weather全球天气预测
华为云计算的研究团队推出了基于深度学习的全球天气预测系统Pangu-Weather。该团队从ECMWF的第五代再分析(ERA5)中收集了43年的每小时全球气象数据,以创建一个数据驱动环境,并用256百万个参数训练了几个深度神经网络。
这是第一个在所有变量(如位势高度、比湿、风速、温度等)和所有时间尺度(从一小时到一周)上精度超过尖端数值天气预报(NWP)技术的基于人工智能的方法。通过使用分层时间聚合策略和将高度(压力水平)数据转换为立方数据的3D Earth Specific Transformer(3DEST)架构,可以提高预测精度。Pangu-Weather可以进行短期到中期的确定性预测,即天气(即预测时间范围从一小时到一周)。
Pangu-Weather提供了多种下游预测选项,例如热带气旋跟踪和实时大成员集合预测。Pangu-Weather回答了基于人工智能的技术是否能够比NWP技术表现更好的问题,并对提升深度学习天气预测系统提出新的建议。
该团队认为他们的训练方法尚未完全收敛。还可以增加观测组件的数量,将时间维度整合到4D深度网络的训练中,并使用更深和/或更宽的网络。这些都需要具有更多内存和浮点运算的GPU支持。因此,由于计算资源的提升,未来的天气预报将会更加准确。
多分辨率深度学习框架
极端天气事件严重威胁人类生活和经济,造成数十亿美元的年度成本和数万人的人员伤亡。由于气候变化,其影响和强度预计会增加。气候预测的主要工具——广义环流模型(GCMs)很遗憾无法充分定义天气极端情况。
来自Verisk Analytics、Otto-von-Guericke大学和麻省理工学院的一组科学家开发了一种多分辨率深度学习框架,以加快极端天气事件的模拟速度。为了消除偏差和提高GCM模拟的分辨率,他们将基于物理的粗分辨率GCM与基于观测数据训练的机器学习模型相结合。
主要成分包括:
- 一种分而治之的训练策略,允许以高空间分辨率训练区域模型
- 新颖的统计损失函数,强调极值和时空一致性
- 在球面上高效捕捉能量传递的紧凑多尺度物理过程表示
决策者可以利用全尺度去偏模拟来查看当前情景,并评估他们对灾害性天气灾害的风险,而且细节可以任意设置。
建议的架构使百万年级的极端天气模拟成为可能,改善了灾害事件量化。随着全球模拟对多个地理位置和威胁相互依赖的需求不断增加,研究人员认为这将有助于满足这一需求。
实时偏差校正风场预报
欧洲中心VoAGI-Range天气预报(ECMWF;简称EC)可以作为发展海上灾害预警系统的基础,但其中存在一些系统性偏差。欧洲委员会的第五代大气再分析(ERA5)数据非常准确,但是相对较晚。EC和ERA5数据之间的非线性映射可以通过时空深度学习方法进行改进,从而实现更准确的EC实时风场预报。
中国海洋大学、国家海洋环境预报中心和朴茨茅斯大学最近的一项研究设计了一种多任务学习损失函数,使用单一模型来校正风速和风向。他们将其应用于Multi-Task-Double Encoder Trajectory Gated Recurrent Unit(MT-DETrajGRU)模型中,该模型采用增强的“双编码预测器”架构来建模时空序列风场分量。该研究在西北太平洋(WNP)作为研究区域,对EC的10天风场预报进行了实时滚动偏差校正,时间跨度为2020年12月至2021年11月,涵盖了四个季节。与原始EC预报相比,经过MT-DETrajGRU模型调整后,四个季节的风速偏差和风向偏差分别减少了8-11%和9-14%。
此外,所提出的技术在不同气候条件下一致地建模了数据。所构建的数据驱动模式具有弹性和泛化能力,不受正常和台风条件下的影响,这一点已经得到证明。团队计划在未来的研究中将影响风场的其他变量,如温度、气压和湿度,纳入模型。
利用天气模式预测风电场功率和下游尾流
ECMWF、波恩大学、伦敦帝国学院、英国气象办公室、埃克塞特和壳牌研究有限公司的一项新研究建立了一种新颖的风能工作流程,首次成功地将复杂的数值天气预报模型与无监督聚类算法相结合,以有效地进行风电场功率和下游尾流的准确长期预测。该过程首先使用ERA5再分析数据上的无监督k-means聚类识别天气趋势,以考虑区域和时间的变化。为了计算聚类功率输出和下游风电场尾流,使用聚类中心的平均气象条件进行WRF模拟。
这项分析确定了用于海上风能生产天气模式的最佳变量和域大小。在运行WRF模拟之后,团队应用了一种独特的后处理方法来改进长期风电功率输出和下游尾流预测。这种新颖的方法可以在不运行模拟的情况下,提供多年和多年代的海上风电场功率和下游尾流估计。尽管先前的研究已经对下游风电场尾流进行了小规模的研究,但这是第一种通过提供精确和快速的长期预测来减小这些尾流的工具,从而改善了对风电场位置的认识。
通过将该方法应用于两个案例研究区域,团队证明了在只占计算工作的2%以下的情况下,所提出的长期预测与一年的WRF模拟结果达成了极好的一致性。在风速分组时,结果最准确。
GraphCast:提供高效的VoAGI-Range全球天气预报
从选择服装到遇到飓风时该怎么办,人们不断根据天气预报调整计划。人们依靠每天发布的“VoAGI-Range”天气预报,这些预报由气象服务机构发布,可以提前十天了解天气。
DeepMind和Google最近进行的一项研究介绍了GraphCast。这个基于机器学习的新型天气模拟器超过了世界上最精确的确定性操作VoAGI范围天气预报系统和所有机器学习基准。GraphCast自回归模型使用来自欧洲中心VoAGI范围天气预报(ECMWF)的ERA5再分析存档中的气象数据进行训练。该模型建立在神经图网络和一种新型的高分辨率多尺度网格表示之上。在赤道上,它的分辨率约为25×25公里,并且可以以6小时间隔为五个表面和六个大气变量的37个垂直压力水平创建为期10天的预报。
在2760个变量和提前时间组合的90.0%中,GraphCast的表现优于ECMWF的确定性操作预报方法HRES。对于其报告的252个目标中的99.2%,GraphCast的表现优于最精确的先前基于机器学习的天气预报模型。借助Cloud TPU v4技术,GraphCast可以在不到60秒的时间内生成一份为期10天的预测数据(35 GB的数据)。
与传统的预报技术不同,基于机器学习的预报可以在有更多可用于训练的数据时轻松地变得更大和更复杂。这项研究对于基于机器学习的天气建模来说是一项重大进展。原则上,它可以应用于更广泛的环境和其他地理时空预测挑战,例如模拟各种气象因素、季节性和气候预测、野火、森林砍伐等。
使用卫星数据进行降水预测的WeatherFusionNet
深度学习方法近年来改善了天气预测的准确性。捷克技术大学的研究人员在2021年AI for Good World Summit Challenge上提出了两个深度学习模型,用于预测极端天气事件中的降水。
第一个模型sat2rad是基于U-Net的深度学习模型,它通过卷积神经网络的空间不变性,在当前卫星帧时间步长中估计降水。即使雷达数据仅适用于较小的区域,该模型也可以为整个卫星区域预测降水。sat2rad模型分别应用于四个卫星帧以生成四个通道。
第二个模型PhyDNet是一种循环卷积网络,它将物理动力学与补充的视觉输入分离开来。PhyDNet的两个分支处理物理动力学和未来预测的剩余信息。由于竞赛限制,PhyDNet是使用卫星数据而不是雷达帧进行训练的。为了进行预测,另一个U-Net将两个模型的输出与输入序列合并。
该研究指出,使用sat2rad和PhyDNet模型可以提高降水预测的准确性。卷积神经网络的空间不变性有助于估计整个卫星区域的降水,即使雷达数据仅适用于较小的区域。
WF-UNet:用于降水现在预测的Weather Fusion UNet
准确的短期预测(现在预测)对于设计严重天气和其后果(如城市洪水或滑坡)的早期警报系统至关重要。现在预测有几种环境用途,从农业管理到提高航空安全。
马斯特里赫特大学和乌特勒支大学的合作研究探索了使用UNet核心模型以及该模型的扩展来预测西欧未来三小时的降水的可行性。他们的研究提出了Weather Fusion UNet(WF-UNet)模型,该模型基于Core 3D-UNet模型,在训练过程中包含了风速和降水等变量,并分析了这些因素对预测降水的性能的影响。
使用欧盟地球观测计划Copernicus的ERA5数据集,该团队在14个欧洲国家的六年时间(2016年1月至2021年12月)内编制了降水和风速的雷达图像,时间分辨率为1小时,空间分辨率为31平方公里。他们将提议的WF-UNet模型与持续模型和其他仅使用降水雷达输入数据训练的基于UNet的体系结构进行了评估。根据研究结果,当时间范围为1、2和3小时时,WF-UNet的均方误差低于其他最佳表现设计的22%,8%和6%。与传统的UNet模型相比,决策层级融合在捕捉存档雷达图像中包含的时空信息方面更为优越。在短期现在预测中,WF-UNet凭借其卓越的特征提取能力优于其他测试过的基于UNet的模型。