遇见ECOGEN:一种新型的深度学习方法,旨在为生物学家和生态学家生成逼真的鸟鸣声

遇见ECOGEN:一种前沿的深度学习技术,致力于为生物学家和生态学家生成逼真的鸟鸣声

深度学习的出现对不同领域产生了重大影响,并将其影响范围扩展至各种领域。其中一个显着的应用是利用深度学习通过鸟鸣来监测稀有鸟类。

通过鸟鸣将鸟类区分开已变得更加便捷,这要归功于为生态学家和公众提供的众多移动应用和软件。然而,当鉴定软件遇到不熟悉的鸟类物种或缺乏参考录音时,就会出现一个主要问题。

生态学家和保护主义者们面临着监测世界上一些最为稀有的鸟类的问题。为了克服这个问题,加拿大蒙克顿大学的研究人员开发了ECOGEN,该系统可以生成逼真的鸟鸣声,以增强那些被低估的物种的样本。然后,这些样本可用于训练生态监测中使用的音频识别工具。

生成音频存在几个挑战,包括合成所需的大量样本。不同的音频文件处理格式被利用,其中很多表示方式会导致信息丢失,这增加了生成高质量音频样本的复杂性。波形表示是一种保持信息完整性的最流行格式之一,它在时间域中记录声压幅度。

为了解决这个问题,ECOGEN创造了新颖的鸟鸣声示例来改进人工智能模型。基本上,ECOGEN可以扩展有限野生录音的物种的声音库,而不会对动物造成伤害或需要额外的野外工作。

研究人员发现,将ECOGEN生成的合成鸟鸣样本添加到鸟鸣识别器中,平均提高了12%的鸟鸣分类准确性。其中一位主要研究人员Nicolas Lecomte博士强调了需要自动化工具(如声学监测)追踪由全球动植物种群的显著变化带来的生物多样性变化的迫切需求。然而,当前用于声学监测物种识别的人工智能模型缺乏详尽的参考库。

研究人员强调,创建合成鸟鸣声可以有助于保护濒危鸟类物种,并为我们提供宝贵的有关它们的鸣叫、行为和栖息地偏好的见解。

Lecomte博士表示,该工具也可以造福其他类型的动物,并表示虽然ECOGEN是为鸟类开发的,但他们相信它可以应用于哺乳动物、鱼类、昆虫和两栖动物。

ECOGEN通过将鸟鸣录音转换为声谱图(声音的可视化表示形式)来运作。随后,它基于这些声谱图生成新的人工智能图像,从而为那些录音有限的稀有物种扩充数据集。然后,这些新生成的声谱图被转换回音频格式,以训练鸟类音频识别模型。在这项研究中,研究人员使用了全球范围内的23,784个野外鸟类录音数据集,涵盖了264个不同的物种。