别名:你的时间序列在欺骗你

别名:时间序列欺骗

用Python直观地介绍信号混叠

混叠风扇。图片由作者提供。

时间序列数据无处不在,充满了丰富的信息。金融市场、工业过程、传感器读数、健康监测、网络流量和经济指标等都是时间序列分析和信号处理必不可少的应用示例。

随着深度学习和其他时间序列预测技术的进步,人们对时间序列的一些基本特性的关注已经转移。在开始任何时间序列项目之前,我们必须问自己,“我们能相信这个数据吗?”

本文将探讨离散时间序列的一种病态特性,即混叠。任何关注时间序列频率或季节性分析的人都必须对混叠及其对业务利润的影响有清楚的认识。在本文中,我们将使用“时间序列”和“信号”这两个术语交替使用。祝您阅读愉快!

一个激发人们兴趣的例子

为了理解混叠是什么以及它有多么具有欺骗性,让我们从一个典型的例子开始。我们将尝试回答一个关于一个基本振荡信号的问题。如果您对混叠不熟悉,答案可能会让您震惊。

问题

考虑以下在一秒钟的时间段内绘制的时间序列。每个点代表一个信号的样本,线条是通过样本的线性插值(假设)帮助我们可视化信号。

一个在一秒钟内采样的振荡信号。图片由作者提供。

此外,假设我们采样的基础信号是连续的。这意味着在任何时间 t,都可以测量信号的值。由于计算和内存限制,我们选择了有限数量的时间点来采样信号。

我们需要回答的问题是:

基础信号有多少个峰值?

换句话说,信号振荡的频率是多少?在继续阅读答案之前,请思考一下…