选择最佳技术/供应商的系统方法:MLOps版本

Systematic approach to selecting the best technology/vendor MLOps version

ML商店中的终极购物狂潮

机器学习应用的出现导致了技术上的差距,从而产生了过多的解决方案和流行词汇🐝。

机器学习正逐渐成为我们生活的方方面面的重要组成部分。不久前,我写了一篇关于选择技术/供应商的系统性方法的文章。

但是,选择一个MLOps解决方案与选择其他技术有所不同,因为它具有较长的生命周期和缺乏成熟的工具支持。您是否为选择适合您业务的正确MLOps解决方案而苦恼?本文就是为您准备的。

模型生命周期涉及的步骤包括开发复杂模型、评估模型并跟踪结果、部署训练好的模型、提供预测、监控和迭代。

简单的步骤

为了简化选择合适的供应商/技术的过程,我提出了一个直接的步骤:

  1. 首先,确定您的需求、资源和限制。
  2. 搜索潜在的解决方案,并排除不符合要求的选项。
  3. 评估剩下的有前景的解决方案。
  4. 做出决策——去还是不去?

说实话,这对于所有技术来说都是通用的,但在每个步骤中,我会给出机器学习的观点。

在下一节中,我们将详细介绍如何确定您的需求、资源和限制。

步骤 1:确定您的需求、资源和限制

选择合适的技术或供应商的第一步是确定您的需求、资源和限制。

要求和需求取决于您在机器学习生命周期中填充的组件/功能,并可以在以下表格中看到。

您拥有的资源也可能影响您选择的解决方案:

  • 总拥有成本和错误成本。
  • 上市时间和维护时间。
  • 团队专业知识和团队规模。包括数据科学家、机器学习工程师和开发运维人员的数量。

在约束方面,有一些是通用的,而其他一些则取决于您在机器学习生命周期中填充的组件/功能。通用的约束条件包括:现有集成、所有权变更、特定的云/本地部署、多租户、合规性和许可证、安全性和可用性。每个组件/功能的约束条件如下:

在下一节中,我们将详细介绍搜索潜在解决方案的步骤。

步骤 2:搜索潜在解决方案

选择合适的供应商/技术的第二步是搜索潜在解决方案。然而,在进行这种搜索之前,熟悉技术术语和流行词汇至关重要,以确保您能够有效评估潜在选项。

一旦你掌握了这些基础知识,你可以开始研究潜在的技术和供应商,并保留一些有前景的选择。

然后策划一个可用选项的简短清单,最好的方法是考虑以下几点:策划一个可用选项的简短清单。

  • 严格按照你的约束条件进行筛选,例如,如果你正在寻找本地解决方案或者你的数据集不平衡,它将过滤掉大部分选项。
  • 选择购买还是自己建立解决方案:如果建立起来容易并且易于维护,那就建立!但是当它的投资回报为正且货架上没有空位时,建立解决方案。如果投资回报为负,则跳过。
  • 选择一体化还是最佳解决方案:一体化对于常见和简单的情况非常好。记住,这是可以的。我们大多数人不是谷歌。在更受限制的环境中,最佳解决方案更适合(还记得之前的清单吗?)。你甚至可以将它们结合起来,在大多数组件都很简单,只有少数受限的情况下。只要确保在你的资源范围内可行。
  • 与社区交流,例如MDLI、MLOps.community、MLOps TLV等等。

在下一节中,我们将详细评估有前景的解决方案。

评估有前景的解决方案

为了评估剩下的有前景的解决方案,你应该采取一些步骤。

  • 首先与供应商或用户交谈:这将帮助你更深入地了解解决方案的能力和限制。重点关注稳定性和人们面临的问题,因为大多数这些解决方案都不成熟。
  • 进行一些POCS:从“Hello World”教程开始,这将帮助你了解解决方案在实践中的工作方式。如果需要,可以进行更详细的POC。
  • 制作比较表:这可以包括版本、支持、社区、定价、约束条件、要求和资源等交互作用。

在下一节中,我们将深入探讨决策。

决策!前进?不前进?

当你在考虑是否继续进行时,请记住最合适的解决方案未必是完美的。

它需要适应你的需求、约束条件和资源。努力找到最能满足组织需求的解决方案,使选择变得不那么令人生畏。在做出是否前进的决策时,要牢记未来的目标,并将灵活性放在决策过程中的优先考虑。

保持专业态度,避免陷入政治斗争或让自己的决策受到个人偏见的驱动。此外,要意识到人类偏见并采取措施予以纠正。

最后一句话

在本文中,我们为您提供了选择适合您业务的正确的机器学习技术或供应商的方法。通过明确您的需求、资源和约束,并寻找潜在的解决方案,您可以做出明智的决策,以与您的目标保持一致。请记住,没有完美的解决方案,因此请专注于最适合您环境的解决方案。

我希望能够与您分享我对这个迷人话题的热情,并希望您能从中受益。如果您有任何问题,请随时通过电子邮件或LinkedIn与我联系。