使用滚动回归估计时间变动系数
使用滚动回归估计时间变动系数
高斯随机游走作为回归系数的先验
回归分析中的一个挑战是要考虑到预测变量和响应变量之间的关系可能随时间变化的可能性。
从数据科学到计量经济学
数据科学家一再遇到这样的情况,即业务有假设,我们的模型必须考虑它们是正确的可能性。
传统的回归模型非常擅长估计E[Y|X]。Xᵢ(或βᵢ)的系数可以解释当Xᵢ增加1时Y的增量变化。在计量经济学中,人们经常假设βᵢ随时间变化,我们可以称之为βᵢₜ。那么我们真正试图估计的是E[Y|X,Time]。这是一家公司2年收入的图表-它是一个季节性的业务,没有理由认为β也是时间相关的。
在本文中,我们将介绍回归中的时间变化系数的概念,并展示它如何应用于市场组合模型。如果您还没有,请查看我关于从头开始构建市场组合模型以及其中涉及的所有要素的VoAGI系列文章。简单回顾一下,市场组合模型是一种统计工具,帮助营销人员衡量不同营销活动(如广告、定价、促销等)对销售或其他结果的影响。一个典型的市场组合模型可以表示为:
其中yₜ是时间t的结果变量(如销售),xᵢₜ是时间t的预测变量(如广告支出、价格等),βᵢ是衡量每个预测变量对结果变量的影响的系数,Ɛₜ是误差项。
然而,该模型假设系数在时间上是恒定的,在某些情况下可能不现实。例如,广告对销售的影响可能会随季节性、产品生命周期、竞争环境等而变化。为了捕捉这种变化,我们可以在回归中使用时间变化的系数,允许系数随时间或某些其他变量的函数而变化。例如,我们可以写成:
其中βᵢ(t)现在是时间或某些其他变量的函数,用于捕捉系数的动态变化。有多种方式可以指定这些函数,例如使用样条、多项式、随机效应等。函数的选择取决于数据的性质和研究问题。
高斯随机游走
当媒体的有效性随时间变化时,可以使用时间变化的函数作为系数来捕捉。其中最受欢迎的选择之一是高斯随机游走。
您会感兴趣地知道,这个过程被用于对金融数据建模,例如股票或黄金。
高斯随机游走是一种随机过程,模拟独立同分布随机变量的累积效应。它也被称为正态随机游走或维纳过程。高斯随机游走可以表示为一个随机变量序列X₁,X₂,…,Xₙ,其中每个Xᵢ都服从均值为0,方差为1的正态分布,并且前3个变量的和为
在时间n,随机行走者的位置。高斯随机行走具有一些重要特性,如是马尔科夫过程、具有平稳增量和概率连续性。
贝叶斯时变MMM的代码
这是我在这篇文章中构建的PyMC模型的升级版本。我添加了代码来根据周、季度、学期或年份变化系数。这种形式的回归也常被称为滚动回归。
让我们看看代码中有什么变化。
首先,您会注意到这个模型现在被包装在一个名为BayesianMMM的函数中。这是为了方便起见,我们可以使用不同的参数运行它。这个示例接受一个名为splits的参数,它决定了您对时间的定义有多细粒度 —— 每周 (W)、每季度 (Q)、半年 (H) 或年对年 (YoY)。
您还会注意到,PyMC模型本身接受一个名为coords的参数,它实际上是您的时间变量。如果您选择每周变化系数,时间变量将是1…104。如果您选择每季度,它将是1,1,1…,2,2,2…,3,3,3…4,4,4…,1,1,1…(记住,这是2年的数据)。
接下来,我们的系数现在是一个GaussianRandomWalk变量,而不是TruncatedNormal。与以前一样,我们将其初始化为位置先验(如果您不记得,请返回这里)。在这个设置中,每个时间段都有自己的系数,但是系数在连续的时间段之间共享信息。这是滚动回归的最大优势。
现在让我们来看看三个案例研究。
案例研究1 — 上漏斗的媒体策略随时间的变化如何?
上漏斗营销指的是旨在在尚未准备好购买的潜在客户中产生认知和兴趣的活动。由于上漏斗营销不直接导致转化或销售,往往很难进行测量,但它以微妙和长期的方式影响客户旅程。然而,了解哪个渠道更有效以及随时间的趋势是有帮助的。
这带来了非常有用的知识。在时间周期开始时,直邮是表现最差的渠道,然后超过了电视。凭经验证实,随着CTV的出现,电视的效果随时间的推移有所减弱。
另一个观察是CTV随时间的推移超过了电子邮件。这些都是有趣的观察结果,但如果没有A/B测试,我们不能得出结论。
案例研究2 — 我的业务是季节性的,在假日季节获得最多的收入。
营销人员不应假设付费搜索的效果在全年都是恒定的,而应根据季度波动和机会来调整他们的广告活动,尤其是在零售和电子商务领域可以观察到一些常规趋势。
付费搜索的效果往往在第四季度最高,尤其是在假日季节,当在线购物活动增加时,消费者更有可能点击提供折扣、优惠或礼品想法的广告。相反,付费搜索的效果可能在第一季度下降,当消费者需求下降时,广告商面临更低的转化率和更高的每次点击成本。第二季度和第三季度的结果可能更稳定或适度,具体取决于特定行业和市场条件。
我们发现付费搜索的效果在第四季度预计最高。
案例研究3 — 我想衡量媒体效果的年度趋势。
年度趋势是指关键绩效指标(KPI)在一年内发生的变化。它们可以帮助营销人员制定实际目标,调整预算,并根据有效策略进行优化。
通过分析历史数据、进行市场调研和测试不同的策略,营销人员可以优化他们的付费搜索效果,并在每个季度实现他们的目标。出版商指导和内部A/B测试也可以确定ROI最高的时段。最后,所有这些都有助于校准我们的MMM。
我们可以看到,年度付费搜索效果提高了大约2%。这样的趋势经常被报道,并归功于营销部门的成功。
结论
如果您已经关注了我的MMM系列文章,我强调了使您的MMM(或任何其他测量)能够被利益相关者理解的重要性。时间变化系数可以帮助回答许多可能提出的问题,这些问题可能无法通过传统的MMM来回答。借助贝叶斯优化技术,我们可以对我们的模型代码进行微调,使其本质上能够回答这些问题。
在回归中使用时间变化系数的一个优势是,它可以提供更准确和灵活的预测变量对结果变量随时间的影响的估计。它还可以帮助确定这些影响何时以及如何变化,以及驱动这些变化的因素是什么。这可以帮助营销人员设计更有效和高效的营销策略,并优化他们的营销组合。
感谢阅读 😊