继承风的意思是跟着风的方向去

继承风的意义是随风而行 (Jìchéng fēng de yìyì shì suí fēng ér xíng)

发现机器学习和人工智能如何改进经典的数值天气预报模型仍处于早期阶段。 Credit:jkgeography.com

在哲学意义上,短语“风之自由”可能是准确的,但在真实的物理世界中,风并非总是自由的;它既带来机遇又带来成本。准确预测风的经济和人道后果不容忽视,无论是在宏观气候还是微观气候层面上。通常,大气现象之间的因果关系在字面上和隐喻上都是同一个方程的一部分。

虽然将人工智能(AI)和机器学习(ML)应用于天气研究的有效性并非新鲜事,但人工智能在运营预报模型中尚未取得显著进展。然而,相对计算经济性的优势使得能够比现有预报模型更快地运行更大的数据集,这导致气象学和计算机科学界为即将到来的显著知识交叉时代做好准备。

在天气研究中,领先的机器学习研究结合了基于历史再分析数据的训练数据集和新观测数据,即使是未使用机器学习的项目数据也可能对未来模型产生巨大收益,反之亦然。

在一组使用传统模型的项目中,科罗拉多州立大学和美国国家海洋和大气管理局(NOAA)的研究人员发现,对美国最广泛使用的High-Resolution Rapid Refresh(HRRR)模型的风预测进行改进,可能会导致全国实际收入增加384亿美元,如果更新后的HRRR模型在模型更新期间得以实施。准确的风力预测对于有效调度公用事业资源至关重要;预测比实际发生的风能量更多可能会导致在最后一刻切换到更昂贵的化石燃料发电。相反,预测风力过少可能会导致在它们可以休息的时候对其他电力来源进行过度调度。

这些项目被称为“风预报改进项目”。第一阶段WFIP-1在2011年至2013年期间在美国大平原和德克萨斯州西部进行数据收集。第二阶段WFIP-2在2015年至2019年期间在太平洋西北地区的俄勒冈州和华盛顿州的哥伦比亚河流域进行。然而,为了实现所发现的节省,需要对微观气候因素进行繁琐的数据收集和分析。例如,参与WFIP-2项目的团队发现,在风力涡轮机的高度准确预测风速受到大气最低部分的“冷池”困扰。在该项目之前,这些池塘的情况尚未准确预测,该项目发现云覆盖对它们的产生有很大影响。

“冷池”对多个方面都是一个问题,NOAA位于科罗拉多州博尔德市的物理科学实验室的研究气象学家Jim Wilczak表示。Wilczak是WFIP-1的NOAA技术经理和WFIP-2的观测负责人。“对于风能来说,它们是一个问题,因为你很少能产生风能。对于空气质量来说,如果你处于其中一个山谷中,人们使用壁炉和汽车释放烟雾和微粒,它们会被困在最接近地面的污染、密集、寒冷层中。”

WFIP工作也可能代表着一个分界点,这是一个在这个时代中,已建立的天气模型,称为数值天气预报(NWP)模型,主要是通过传统的计算技术进行分析和修改的时代。WFIP研究人员使用的NWP模型包含从观测条件中获得的数据,然后通过复杂的物理方程进行运行,其中不包括先前的风速测量或云覆盖等因素的机器学习。尽管基于机器学习的天气预测的运营结果仍处于初级阶段,但Wilczak表示他不认为现状会持续太久。

“WFIP-1或WFIP-2实际上并没有应用机器学习。我们严格试图改进实际的NWP模型,“他说。“但我认为,机器学习模型很快就会超过当前NWP模型的预报技能。”

确切地说,机器学习和人工智能如何提升经典NWP模型还处于早期阶段,但这些技术的潜力对Wilczak和其他人来说是相当明显的。

例如,Wilczak表示,在哥伦比亚河峡谷等地发现的冷池等数据在其他地方研究风力,如纽约州的山顶风力发电厂,很难传递。

然而,未来任何地方使用ML进行类似地形的研究的研究人员(或操作气象学家)可能能够利用这些原始数据与再分析数据一起工作。

“从这个意义上说,像WFIP这样的实地项目可能对提供ML算法所需的测量数据非常重要,以试图改进预报,”Wilczak说。

添加此类数据不必花费大量计算资源;在2023年8月发表的美国气象学会公报中,Paul J. Roebber和Stephan Smith在一篇总结性论文中指出努力将AI纳入美国国家气象服务中时引用了一项研究,该研究使用深度学习模型通过再分析数据在几个小时内在单个图形处理单元上生成了85,800次重复预报。

卫星和LLM启发式研究

北半球的晚夏和早秋是热带风暴和飓风形成的高峰期,这些热带风暴和飓风可能安全地移到海洋上或者灾难性地登陆,摧毁财产并造成广泛的伤亡。 2022年9月,飓风伊恩(Hurricane Ian)在登陆佛罗里达时,持续风速达每小时150英里,致使古巴和美国共160人死亡,损失金额在500亿至650亿美元之间。最广泛使用的两个预报模型GFS和Euro在风暴登陆地点上有分歧,这可能导致死亡人数超出预期。

2023年最大的飓风之一,飓风李(Hurricane Lee),有可能同样具有灾难性并且难以预测。当它在南大西洋洋面翻滚时,可能威胁到美国和加拿大东北海岸的大片区域,人工智能气象研究的先驱们告诉通讯部他们的工作可能会使对此类风暴的预测更加容易。

“绝对可以,是的,我们的工作可以帮助收集类似李飓风的数据,”亚利桑那大学气候动力学和水文气象中心主任Xubin Zeng在最近一次的研究中说。他们使用红外卫星图像数据以水汽运动来预测多个高度上的风速。研究的主要作者,研究科学家Amir Ouyed,开发了ML算法来处理这些图像。与气象气球的测量数据进行比较,从他们的方法中得出的风速数据在误差范围内与现有卫星风速产品相匹配,并且在垂直分辨率上表现更好。

“我们的工作之所以有价值的部分原因是,你在公海上没有真正的风力观测数据,”Zeng说。“这就是为什么每个飓风季节NOAA都花费如此多的金钱发送飞机进行测量。”

欧洲AtmoRep的首席科学家Christian Lessig表示,这种技术可能确实对严重天气预测有所帮助,“也许无法精确预测飓风的路径,但可以进行更好的概率预测。因为AI模型比传统模型更便宜,因此可以生成更大的集合,并获得飓风可能移动的更高的概率。”

Zeng和Lessig的项目可能代表了探索风力预测中的人工智能的阴阳两极。曾教授的团队研究了相对较小的图像,以推导在给定垂直堆栈内不同高度的风速的计算机视觉辅助预测,这在可操作预报所需的气象仪器上是不可行的。由于由一个NOAA卫星的意外延长寿命,该卫星与较新的卫星在同一个圈内旋转,但相差50分钟,曾教授及其团队能够使用不同化的像素化数据来识别水汽的移动,这受到风如何移动水汽的影响,人眼无法察觉到。

另一方面,AtmoRep受到大型语言模型(LLM)的原理启发。其创作者的目标是训练一个生成性神经网络,代表并描述所有大气动力学,包括风;其模块化特性使得研究人员和预报员可以提取出各种元素,包括风、降水、温度等等。然而,建立这样一个模型的挑战是令人艰巨的。它需要处理比自然语言处理模型更复杂的过程和数据集;该模型具有35亿个参数。

AtmoRep在欧洲中心为VoAGI-Range Weather Forecast(ECMWF)ERA5再分析数据集上进行训练,该数据集包括不同高度处的空气温度、空气压力和风速的小时估计。它还包括地表参数,如降雨、土壤含水量、海浪高度和海面温度,时间跨度从1940年1月至今。

为了减轻训练数据中固有的偏差,AtmoRep还可以使用当代观测数据,正如Wilczak所推测的;在他们的初稿介绍到这个项目中,该初稿早在九月初被修订了一次,AtmoRep团队引入了德国国家气象服务的RADKLIM降水雷达数据。结果显示,AtmoRep预报的降水场的范围和形状与RADKLIM数据相比更接近原始ERA5数据。

Lessig说,从理论上讲,曾同学的研究等可以非常有用地添加到AtmoRep等神经网络中。

他说:“机器学习的优势之一是它可以将不同的数据源结合到一个连贯的神经网络模型中,比如针对非常不同的源自文本的LLM,或者将文本和图像结合成抽象内部表示的文本-图像模型。因此,可以设想通过对再分析和欧叶德以及他的同事获得的数据进行训练,相互丰富彼此。”

Lessig表示,曾团队的图片分辨率相对较低——1度,即100公里——限制了它在降尺度(将大尺度模型数据转换为较小空间尺度,如单个流域)上的实用性。然而,他指出,其他卫星测量具有1-5千米的分辨率,陆地观测系统的分辨率为10米左右。Lessig表示,他希望团队开源AtmoRep代码的意图能够鼓励其他人共享并在真正的社区模式下获取数据和代码。

曾的研究和WFIP项目可能正是这样一个社区可以建立起来的基础。曾表示,他团队工作的结果是未来卫星任务可行性的证明,他们希望提供10千米分辨率,并补充说气象学和机器学习研究之间的交叉污染正处于一个令人兴奋的时刻。

“我的团队不是这项实际技术的开发者,我们是从计算机科学领域借用它的。”曾说。“这就是科学工作方式。我们互相学习。”

Gregory Goth是一位专注于科学和技术的位于康涅狄格州奥克维尔的作家。