一种更好的研究海洋流的方法
一种新的机器学习模型可以更准确地预测海洋洋流,从而有助于跟踪塑料污染和油污泄漏,并在搜索和救援方面提供帮助
科学家为了研究洋流,在海洋中放置GPS标记的浮标,并记录它们的速度来重建运输它们的洋流。这些浮标数据还用于识别“分歧点”,即水从表面以下升起或下沉的区域。
通过准确地预测洋流并确定分歧点,科学家可以更精确地预测天气,近似估算油泄漏后的扩散情况,或者测量海洋中的能量转移。一项新的整合了机器学习的模型比传统模型更准确地进行预测,一项新研究报告。
包括麻省理工学院计算机科学家和海洋学家在内的跨学科研究团队发现,通常用于浮标数据的标准统计模型可能难以准确重建洋流或识别分歧点,因为它对水的行为做出了不切实际的假设。
研究人员开发了一个新模型,它整合了流体动力学的知识,以更好地反映海洋洋流中的物理学原理。他们展示了他们的方法,只需要少量额外的计算开销,就比传统模型更准确地预测洋流和识别分歧点。
这个新模型可以帮助海洋学家更准确地估计浮标数据,这将使他们能够更有效地监测生物量(如裙带菜海藻)、碳、塑料、石油和海洋中的营养物。这些信息对于理解和追踪气候变化也是重要的。
“我们的方法更恰当、更准确地捕捉了物理假设。在这种情况下,我们已经了解了很多物理学。我们给模型一些信息,让它专注于学习对我们重要的东西,例如远离浮标的洋流或分歧点何时发生以及发生在哪里。”高级作者Tamara Broderick说道。她是麻省理工学院电气工程和计算机科学系(EECS)的副教授,是信息和决策系统实验室和数据、系统及社会研究所的成员。
Broderick的合作者包括首席作者Renato Berlinghieri,他是一名电气工程和计算机科学研究生;Columbia大学的博士后Brian L. Trippe;MIT的博士后David R. Burt和Ryan Giordano;加州大学洛杉矶分校大气和海洋科学助理研究员Kaushik Srinivasan;迈阿密大学海洋科学系教授Tamay Özgökmen;以及迈阿密大学的研究生Junfei Xia。该研究将在国际机器学习会议上展示。
深入挖掘数据
海洋学家使用浮标速度数据来预测洋流并识别“分歧点”,即水升至表面或下沉更深的地方。
为了估算洋流和找到分歧点,海洋学家使用一种称为高斯过程的机器学习技术,即使数据很稀疏,也可以进行预测。为了在这种情况下有效工作,高斯过程必须对数据进行假设以生成预测。
将高斯过程应用于海洋数据的标准方法假定当前的纬度和经度分量是不相关的。但这个假设在物理上并不准确。例如,这个现有模型意味着一个洋流的分歧和它的涡度(流体的旋转运动)在相同的数量级和长度尺度上操作。海洋科学家知道这是不正确的,Broderick说。以前的模型还假定参考系很重要,这意味着在纬度与经度方向上流体将表现出不同的行为。
“我们认为我们可以通过结合物理学来解决这些问题。”她说。
他们建立了一个新模型,使用所谓的亥姆霍兹分解来准确表示流体动力学原理。这种方法通过将洋流分解为涡度分量(捕捉旋转运动)和分歧分量(捕捉水升起或下沉)来建模。
这样,他们赋予模型一些基本的物理知识,以便用于进行更准确的预测。
这个新模型利用与旧模型相同的数据。虽然他们的方法可能需要更多的计算开销,但研究人员表明,额外的成本相对较小。
浮力表现
他们使用合成和真实海洋浮标数据评估了新模型。因为合成数据是研究人员制造的,所以他们可以将模型的预测与地面真实的洋流和分歧点进行比较。但模拟涉及到可能不反映现实情况的假设,因此研究人员还使用在墨西哥湾释放的真实浮标数据测试了他们的模型。
在每个案例中,与标准的高斯过程和使用神经网络的另一种机器学习方法相比,他们的方法在预测涡流和识别分歧时表现出更好的性能。例如,在一个包括邻接海洋涡旋的模拟中,新方法正确地预测了没有分歧,而之前的高斯过程方法和神经网络方法都预测了具有非常高置信度的分歧。
Broderick补充说,该技术还擅长从一小组浮标中识别涡旋。
现在,他们已经证明了使用Helmholtz分解的有效性,研究人员希望将时间元素纳入他们的模型中,因为电流不仅可以在空间上变化,还可以随时间变化。此外,他们希望更好地捕捉噪声对数据的影响,例如有时会影响浮标速度的风。将这种噪声与数据分离可能会使他们的方法更准确。
“我们希望从这些浮标观测到的带有噪声的速度领域中,并说出实际的分歧和实际的涡旋,然后预测远离这些浮标,我们认为我们的新技术对此将有所帮助,”她说。
“作者巧妙地将流体动力学中已知的行为整合到灵活的模型中来模拟海洋电流,”Brigham and Women’s Hospital的副生物统计学家、哈佛医学院的讲师Massimiliano Russo说道,他没有参与到这项工作中。“由此产生的方法保留了模拟电流非线性的灵活性,但也可以表征诸如涡旋和连接电流等现象,这些现象只有在将流体动力学结构整合到模型中时才会被注意到。这是一个优秀的例子,说明灵活的模型可以通过良好考虑和科学合理的规范而大大改进。”
这项研究得到了海军研究办公室(Office of Naval Research)的支持,通过“机器学习用于亚中尺度表征、海洋预测和探索(ML-SCOPE)”计划的多大学研究计划资助。它还在一定程度上得到了国家科学基金会(NSF)职业生涯奖和迈阿密大学罗森斯蒂尔海洋、大气和地球科学学院的支持。