潮汐(TiDE):让变形金刚相形见绌的“尴尬”简单多层感知机(MLP)
潮汐(TiDE):让“尴尬”的简单多层感知机(MLP)让变形金刚相形见绌
深入探究TiDE,使用Darts进行实施和与DeepAR(Transformer架构)进行实际使用案例比较
随着行业不断演变,精确的预测变得非常重要,不论您是在电子商务、医疗保健、零售甚至农业领域工作。能够预见未来并相应地制定计划以克服未来的挑战,这一点可以让您领先于竞争对手,并在边际利润微薄、客户要求更高的经济环境中取得成功。
近年来,Transformer架构一直是人工智能领域的热门话题,特别是由于在自然语言处理(NLP)方面的成功,chatGPT成为最成功的应用之一,无论您是不是热衷于人工智能,它都吸引了每个人的注意。然而,NLP并不是唯一一个Transformers在最先进解决方案上展现优势的领域,在计算机视觉中,稳定的扩散(Stable Diffusion)及其变种也如此。
但是Transformer在时间序列上能否超越最先进的模型?尽管为时间序列预测开发了许多Transformer模型,但似乎在长期预测方面,简单的线性模型可以胜过很多基于Transformer的方法。
本文将探讨TiDE,一种简单的深度学习模型,能够在长期预测中击败Transformer架构。我还提供了一种逐步实现TiDE的方法,使用Python的Darts预测库预测沃尔玛数据集中的每周销售情况。最后,我将比较TiDE和DeepAR在我公司的一个实际应用案例中的性能。
如往常一样,代码可在Github上找到。
时间序列密集编码模型(TiDE)
TiDE是一种新颖的时间序列编码-解码模型,已经证明在长期预测中表现优于最先进的Transformer模型[1]。它是一种多变量时间序列模型,能够使用静态协变量(例如产品的品牌)和动态协变量(例如产品的价格)…