使用Amazon SageMaker Canvas UI和AutoML API,将时间序列预测速度提升高达50%

「利用Amazon SageMaker Canvas UI和AutoML API,将时间序列预测速度提升高达50%」

我们很高兴地宣布,Amazon SageMaker Canvas现在提供了更快、更用户友好的方式来创建时间序列预测的机器学习模型。SageMaker Canvas是一种可视化的点对点服务,使业务分析师能够生成准确的机器学习(ML)模型,无需任何机器学习经验,也不需要编写一行代码。

SageMaker Canvas支持许多用例,包括零售中的库存管理的时间序列预测,在制造业中的需求规划,旅游和酒店业的人力资源和客户规划,金融业的收入预测以及许多其他重要的业务决策中,准确的预测非常重要。例如,时间序列预测可以帮助零售商预测未来的销售需求,并计划库存水平、物流和营销活动。SageMaker Canvas中的时间序列预测模型使用先进的技术结合了统计学和机器学习算法,提供了高度准确的预测。

在本篇文章中,我们将介绍SageMaker Canvas对预测能力的增强,并指导您如何使用其用户界面(UI)和时间序列预测的自动机器学习(AutoML)APIs。虽然SageMaker Canvas UI提供了无代码的可视化界面,但API可以让开发人员以编程的方式与这些功能进行交互。这两者都可以从SageMaker控制台中访问。

预测体验的提升

随着今天的发布,SageMaker Canvas使用自动机器学习(AutoML)升级了其预测能力,相比先前版本,各种基准数据集模型的构建性能提高了50%,平均预测速度提高了45%。这将将典型的数据批次包含750个时间序列,数据大小高达100 MB的模型的平均训练持续时间从186分钟缩短到73分钟,并且平均预测时间从33分钟缩短到18分钟。用户现在还可以通过Amazon SageMaker Autopilot的APIs以编程方式访问模型构建和预测功能,这些功能还附带模型的可解释性和性能报告。

以前,引入增量数据需要重新训练整个模型,这需要很长时间,导致运营延迟。现在,在SageMaker Canvas中,您可以将最新的数据添加到模型中,生成未来的预测,而无需重新训练整个模型。只需将增量数据输入到模型中,即可将最新的见解应用于即将到来的预测,从而加速预测过程,并更快地将结果应用于业务流程。

现在,SageMaker Canvas使用自动机器学习(AutoML)进行预测,您可以通过SageMaker Autopilot APIs来利用模型构建和预测功能,确保UI和API之间的一致性。例如,您可以首先在UI中构建模型,然后切换到使用API来生成预测。这种更新的建模方法还以多种方式提高了模型的透明性:

  1. 用户可以访问解释性报告,更清晰地了解影响预测的因素。这对风险、合规团队和外部监管机构非常有价值。该报告说明了数据集属性如何影响特定的时间序列预测。它使用影响评分来衡量每个属性的相对作用,指示它们是否放大或减少预测值。
  2. 您现在可以访问经过训练的模型,并将其部署到SageMaker推理或您首选的基础设施进行预测。
  3. 提供性能报告,深入了解AutoML为特定时间序列选择的最佳模型以及训练过程中使用的超参数。

使用SageMaker Canvas UI生成时间序列预测

SageMaker Canvas UI可以无需编码将云端或本地的数据源无缝集成,轻松合并数据集,训练精准模型,并使用新数据进行预测。让我们探索使用此UI生成时间序列预测。

首先,您可以从各种来源将数据导入到SageMaker Canvas中,包括从您的计算机上的本地文件,Amazon简单存储服务(Amazon S3)桶,Amazon AthenaSnowflake,和其他40多种数据源。导入数据后,您可以探索和可视化数据,以获取额外的见解,例如散点图或条形图。当您准备创建模型时,只需在配置必要参数后点击几下即可实现,例如选择要预测的目标列,并指定未来要预测的天数。以下截图显示了基于特定店铺位置的产品每周历史需求数据进行预测的可视化示例:

以下图片展示了特定产品在不同商店位置的每周销售预测:

有关如何使用SageMaker Canvas UI进行预测的全面指南,请查看此博文

如果您需要自动化的工作流程或将ML模型直接集成到应用程序中,我们的预测功能可通过API实现。在以下部分,我们提供了一个详细说明如何使用我们的APIs进行自动预测的示例解决方案。

使用API生成时间序列预测

让我们深入了解如何使用API训练模型并生成预测。对于此演示,假设公司需要预测各个商店的产品库存水平以满足客户需求。从高层次上看,API交互可拆分为以下步骤:

  1. 准备数据集。
  2. 创建SageMaker Autopilot作业。
  3. 评估Autopilot作业:
    1. 探索模型准确度指标和回测结果。
    2. 探索模型可解释性报告。
  4. 从模型生成预测:
    1. 使用作为Autopilot作业一部分创建的实时推理终点; 或
    2. 使用批量转换作业。

展示使用API进行预测的Amazon SageMaker Studio示例笔记本

我们在GitHub上提供了一个示例SageMaker Studio笔记本,可帮助您在业务更倾向于通过编程API进行预测时,加快上市时间。该笔记本提供了一个样本合成数据集,可通过公共S3存储桶获得。笔记本将指导您完成上述工作流程图中提到的所有步骤。虽然笔记本提供了一个基本框架,但您可以根据您的特定用例调整代码示例。这包括修改以匹配您的独特数据模式、时间分辨率、预测区间和其他必要参数,以实现您的预期结果。

结论

SageMaker Canvas通过提供用户友好的、无代码体验,使时间序列预测变得民主化,赋予业务分析师创建高度准确的机器学习模型的能力。凭借今天的AutoML升级,它能够提供高达50%的更快模型构建速度,高达45%的更快预测速度,并引入了用于模型构建和预测函数的API访问,提升了其透明度和一致性。SageMaker Canvas的独特能力在不重新训练的情况下无缝处理增量数据,确保迅速适应不断变化的业务需求。

无论您更喜欢直观的UI还是多功能的APIs,SageMaker Canvas简化了数据集成、模型训练和预测,使其成为数据驱动的决策和创新在各个行业中的关键工具。

要了解更多信息,请查看文档,或浏览我们GitHub存储库中的笔记本。有关使用SageMaker Canvas进行时间序列预测的定价信息,请参阅SageMaker Canvas 定价页面;使用SageMaker Autopilot APIs进行训练和推理的SageMaker定价信息,请参阅SageMaker 定价页面。

这些功能可在SageMaker Canvas和SageMaker Autopilot公开访问的所有AWS地区中使用。有关地区可用性的更多信息,请参阅按地区的AWS服务