跨越AI深渊:OpenAI如何让LLMs成为主流成功
AI赋能之路:OpenAI如何推动LLMs成为主流成功
为什么LLMOps将和MLOps一样遭遇同样的命运
我对ML开发工具的可行性(广义上归类为MLOps)一直持怀疑态度,很少有例外地被证明是正确的。缺乏统一的设计导致了碎片化的“微市场”,价值捕获很少,主要原因是有开源替代品和云供应商提供免费的ML工具(以收取基础设施层的收入)。那么是什么导致LLM超越了这些问题,获得了爆发式媒体关注,并实现了真正的广泛应用?那么所有试图将MLOps转变为LLMOps的创业公司将会发生什么?
在本文中,我将运用“创新扩散”理论以及“跨越沟壑”概念,试图解释我对LLM提供商(如OpenAI或Anthropic)的乐观预期,以及我对将MLOps作为LLMOps复活的悲观看法。
创新的采纳和沟壑
根据埃弗雷特·罗杰斯的《创新扩散理论》,创新产品逐渐被具有不同特点的不同采纳者群体逐步接受。首先尝试新产品的是愿意冒险并具有较高失败容忍度的创新者。抵触变化的是最后采纳的人。著名的钟形曲线图显示了每个类别中采纳者的百分比,累积采纳的图表则呈现了一个创新产品在市场份额随时间变化的熟悉的“S形曲线”模式。
基本思想是每个群体都受前面群体的信号和行为影响,依靠社会证明来决定采纳新产品的决策。这是一个被广泛理解和经验验证的现象,不仅在窗式空调机到iPhone等各种产品中观察到。
“沟壑”是由杰弗里·A·摩尔的《跨越沟壑》概念所普及,其基于罗杰斯的理论。摩尔认为,初创市场和主流市场之间的差异太大,大多数产品在尝试跨越这个“沟壑”时失败,这是科技初创公司中相当普遍的失败模式之一。
尽管罗杰斯批评了沟壑的概念,称创新扩散是一个“社会过程”,“相邻的采纳者类别之间没有明显的断裂或不连续”,但显然许多产品未能达到主流,因为它们从未越过创新者群体。
摩尔提供了一些建议,用来跨越沟壑,我只部分同意。其中一个观察是,用他自己的话说,他的书主要将沟壑“作为市场发展问题”处理,并侧重于“跨越沟壑的营销策略和战术”。他确实涉及到了“整体产品管理”的概念,但基于他对西奥多·莱维特的《市场营销的想象力》的理解,该概念局限于通过“服务和附属产品”来弥合市场信息与产品真相之间的差距。他没有涉及产品的实际演进。实际上,创新(也就是核心产品)被当作一个不变的常数。
考虑到软件(尤其是开发工具)的特定属性,我提出了两种避免鸿沟的策略(“发展”和“跳过”),并推断它们的应用如何推动低语言模型的迅速崛起。
两种以产品为中心的避免鸿沟的方法
随着时间的推移演化(简化)您的开发工具
产品是一个恒定的限制,而“整个产品”的其他方面(如消息传递、分销、定价)变化以吸引不同的采用群体,这主要是由于实物产品的动机。如果您从事生产和销售小工具的业务,改变您的供应链或改造您的工厂并不是一件微不足道的事情。然而,对于纯粹是软件的产品来说,这是一个完全不同的故事。不演进您的软件产品几乎总是导致失败的配方。
从目前大多数软件创业公司的起点来看,演进的必要性应该是显而易见的。往往在专业领域内拥有强大和忠诚的用户群体中诞生和培养开发工具(尤其是人工智能方面)。这些早期用户通常是创新者,并且通常不代表更广泛的市场。创始人很容易花费全部时间和精力在这一群体上,并根据他们的反馈调整产品。不幸的是,商业成功很少出现在这些最初的群体中。创新者非常复杂,通常更喜欢自建而不是购买。即使他们决定购买,他们也不代表足够大的市场。
解决这个问题的一个方法是随着时间的推移为不同的目标受众演进产品。对于设计良好的开发工具来说,这意味着引入新的抽象层和/或支持更广泛使用的编程语言。以我之前的雇主为例,Spark的持续成功(至少在我看来)部分归功于产品表面不断简化,以吸引更广泛的用户群体(我敢说是早期多数用户?)。 Spark最初使用RDD(可靠分布式数据集)和Scala作为主要编程语言。然后,它扩展了对Python的语言支持,通过PySpark向更广泛的软件工程师打开了门(同时引入了简化API,如DataFrame和SparkSQL,以吸引SQL分析师)。最近,Spark还添加了与Pandas兼容的API(以吸引数据科学家),甚至还引入了一种使用LLMs的“英语SDK”(以向任何懂英语的人开放)。如果Spark没有以这种方式演变,它将一直停留在只有在Scala中编写复杂MapReduce程序的专家创新者部分。
这个策略似乎有些显而易见,但并不是很多技术产品(特别是在开发工具方面)都能正确实施。它们有时通过移除一些选项来“简化”产品,但未能引入非泄漏的新的抽象层。
完全跳过鸿沟
另一种在开发工具中不太常见的方法是完全跳过鸿沟。这个想法看起来很简单:如果在早期市场上的成功并不能自动转化为在主流市场上的成功,为什么不直接瞄准早期多数用户呢?
如前所述,这在硬件领域更为重要,因为产品的迭代速度较慢、成本较高,结果核心产品无法如此轻松地演化。iPhone是一个很好的例子,它经常受到创新者的批评(甚至包括最近的iPhone 15和其“令人失望的”USB-C接口),但在不关心这些技术细节的早期多数用户中取得了飞速的成功。实际上,苹果一再通过他们的消息向行业展示了这种策略的精髓。也许最著名的例子是“1,000首歌在您的口袋中”的广告宣传活动,它是针对早期多数用户而不是关心技术规格的创新者。
这对许多技术初创公司(尤其是那些专注于开发者工具的公司)似乎不自然,因为很容易在创新者和早期采用者中取得早期成功。人工智能开发工具在早期市场上几乎是必然的,因为它们通常是由先进的人工智能研究人员或机器学习工程师构建的。通过在GitHub上发布开源项目并通过星标测量“产品与市场的契合度”的做法进一步强化了这一点。
在商业化开源项目中常见的失败策略
我见过足够多的“开源项目变成初创公司”以至于我至少具备对常见失败方式的“模式识别”。当这些初创公司经历着GitHub上的星标或PyPI下载量不断增长的采用时,它们就会获得早期的成功(和资金支持)。然后,它们不幸地走上了类似的道路,有时甚至有经验丰富的创始人“之前做过”的(因为他们实际上不了解他们之前的公司为何成功)。
向创新者推销高级产品:直观地(说得天真点,或者幼稚点?),大多数初创公司首先尝试向创新者推销开源产品的“管理”版本。这种策略通常失败,因为早期的创新者根据定义非常复杂,并且更喜欢自己动手建设而不是购买。对于这个受众来说,“管理的开源软件 + 稳定性,可扩展性,安全性”的通用3S策略是不足够的理由来写支票,因为他们已经知道如何构建和运行服务。创新者还担心“供应商锁定”以及失去独立创新的能力。
产品与市场不匹配:下一步尝试是将同样的“管理的开源软件”产品销售给早期多数人。但通常会失败,因为核心产品仍然是优化给创新者使用的难以使用的产品。仅仅添加3S是不足以激励早期多数人提升能力(就像计划培训数百万机器学习工程师以强制引出MLOps市场一样)。如果这还不够的话,彻底的失败在于没有人能在此竞赛中击败亚马逊AWS(这也是越来越多基础设施开源项目选择非商业许可证的原因)。
“全产品”:我将这种策略讽刺地称为“全产品”,因为这个术语已被滥用来通过次优的方式填补基本产品差距。这种尝试通常是在意识到核心产品对更大市场来说过于复杂之后。而解决方案通常涉及“为问题增加人力资源”。这导致初创公司营收结构中有很高的服务组件(没有投资者喜欢看到)和臃肿的交付组织。公平地说,某种程度的服务组件是必要的,特别是在企业领域或政府领域。但通常情况下,初创公司开始变得像一家技术咨询公司。
开发者工具的混合方法
我提出的策略是一种混合方法,它仍然允许与创新者这个忠诚用户群体进行快速迭代,但明确关注早期和主流市场之间的根本差异,并将注意力从产品定义中转向早期多数人。
如果你认识到创新者和商业化与早期多数人的商业可行性并不矛盾,通过开源来证明创新者的早期成功就不必与早期多数人的商业可行性相冲突。具体而言,我建议:
- 使用开源项目赢得创新者的欢迎
- 利用这种受欢迎程度来筹集资金
- 利用创新者群体了解他们如何为下游创造价值以及为谁
- 将你的主流产品定位到这个受众群体
这就是软件创新的扩散与消费类硬件(如iPhone)的不同之处:关键洞察是,在软件价值链中,创新者通常是早期多数人的中间商(中间人?)。换句话说,创新者本身并不是价值链的终点。他们使用技术来帮助产品/业务团队创造价值。有时候,这会以“卓越中心”或“中央创新团队”的形式出现。技术初创公司的目标应该是了解在这些创新者后面的价值链上有谁,这就是他们找到早期多数人的关键所在。至关重要的是,我并不是说你应该试图从那些已经存在的组织中瓦解这些创新者的地位,因为那通常会引发政治上的反弹。在这种情况下,你需要把他们变成你的“拥护者”。
科技初创公司的目标应该是了解在那些创新者之后的价值链上谁会坐在那里,这是他们找到“早期多数群体”关键的地方。
“跳跃”策略的主要影响是在产品定义阶段做出明确决策,以满足“早期多数群体”的需求。需要注意的是,与“进化”策略不同的是,“主流产品”可能不仅仅只是你原始产品的简化版本,而是可能采取完全不同的形态。这种不同形态的两个极端是:
- 比原始OSS项目更高层次的抽象,采用不同的形态。尽管并不完美,Databricks为此提供了另一个例子。打破创新者群体之外的初步兴趣的产品不仅仅是“托管的Spark”,而是为数据科学家和工程师提供的托管笔记本产品(在这个时间点上,这是相当新颖的)。Databricks今天继续追随同样的策略,推出诸如Databricks SQL之类的产品。
- 更加专注的纵向产品,价值链更高。Stripe是一个很好的例子,他们最初是用一个开源的支付处理库起家,然后通过Checkout(网站的全款支付表单)或Terminal(销售点结账终端)等产品取得了成功。
MLOps如何未能进化,以及LLMs如何跳过渊博
MLOps卡在早期市场
关于Spark演进的故事,无法与机器学习(ML)相关的故事相提并论。MLOps栈在几年前看起来和现在几乎一样,市场的希望是越来越多的工程师将学会如何使用它。
不去回顾我们是如何到达目前的状态,让我简要总结一下我对MLOps市场现状的看法:
- MLOps市场尚未形成“主导设计”,因此每个“MLOps平台”在明显和微妙的方式上都有所不同。
- 从系统层面上看,MLOps市场还没有产生更简化的“形态”,或者说抽象层次,因此仍然过于复杂,并需要几个专门的角色(数据工程师,数据科学家,机器学习工程师等),这些角色仅在最先进的技术公司中普遍存在。
- 能够使用这项技术的受众,即创新者和早期采用者,更喜欢生活在尖端,并使用开源工具,而不是支付供应商。
- 愿意付费给供应商的受众通常会选择主流云服务提供商所提供的服务。云提供商将“ML平台”层免费提供,并满足存储和计算方面的收入。
- 由于云供应商尚未明确推行MLOps的商业化,因此该市场的价值提取是微不足道的。
总之,MLOps陷入了渊博,没有迹象显示它会重新出现。
LLMs在早期多数人群中的吸引力
LLMs进入市场并取得了巨大成功,这与MLOps初创公司不同。事实上,你可能将前十家MLOps初创公司的收入合计起来,还不足以与LLMs相提并论。记住,大多数云供应商实际上并没有在计算和存储以外的领域实现该层的商业化,因此他们的“ML”收入并不真正计算在内(除非你想从事以商品价格提供云基础设施的业务)。
这让人不禁提问,为什么LLMs能够如此迅速地取得主流成功?我认为,他们在两个非常不同的领域成功地跳过了渊博。
在开发者领域跳过渊博
传统的“辨别式”机器学习模型是针对非常特定的任务进行训练的,比如预测销售线索的质量或对产品列表进行排名。为了完成每个任务,需要几位专家共同编写数据管道、收集标签、优化所谓的“特征”,训练和微调模型,评估模型,部署模型,监控性能,然后定期重新训练模型。无论是为每个任务都需要重复这一过程,还是为实现这一奇迹所需要的专业知识量,这都意味着只有少数人具备这种能力。
“生成式”语言模型,另一方面,可以为各种用例提供“即插即用”的功能,使任何可以进行API调用的人都能将人工智能应用于他们的产品或问题。几乎一夜之间,LLM解决了“应用人工智能”领域的人才短缺问题,使每个软件工程师都具备了人工智能的超能力。关键是,同一个LLM可以生成诗歌、编写代码、将自然语言问题翻译成SQL查询,或通过各种标准化测试。这要么“开箱即用”(零-shot),要么通过给模型提供一些解决问题的示例(少量样本)来实现,而且适用于各种形式,不仅仅是文本。
这正是直接跨越鸿沟并直接进入早期多数人群的明确定义。
这也是为什么LLMOps注定会重复历史的原因。我想,如果你手里有一把锤子,任何东西看起来都像个钉子。不可避免地,围绕着每个人都需要训练和微调自己的LLM的想法出现了一个小型行业,这完全忽略了LLM之所以在首次成功的核心原因。如果将编写数据管道、训练和微调自己的模型、部署它们等复杂性再加回去,你就又回到了创新者所青睐的建立而非购买的微型市场。
请注意,我并不是说没有人应该微调和部署自己的LLM。在某些非常特定的情况下(这种情况很少见),这样做是有道理的。但在几乎所有这些情况中,你会发现自己处于创新者和早期采用者群体中,而这些群体只会使用开源工具,而不会为了获益而付费给供应商。
跳过消费者市场的鸿沟
OpenAI在两个非常不同的市场中发挥作用:上述讨论的开发者市场通过API和专用计算能力得到服务。另一方面,ChatGPT及其移动应用程序则是非常“消费者”产品。ChatGPT以其友好和易于使用的形式迅速发展,成为仅有5天便达到100万用户最快的产品之一(虽然没有官方的收入数据分析,但一项估算将来自移动应用的收入估计为每月300万美元)。这听起来不像是一个通过早期市场缓慢增长的产品,对吗?
尽管它的术语听起来有一些专业性(GPT代表生成式预训练变换器),但ChatGPT直接跳过了早期多数人群,这主要是因为它友好易用的外形因素。任何人,从记者到教师或学生,都可以免费使用它并立即体验到其价值。如果OpenAI只是发布了一个工程师可以通过REST API调用的模型,它不会导致主流用户大规模采用。
大多数高管会告诉你,在两个截然不同的市场间分散注意力通常是一个坏主意。然而,我认为ChatGPT在消费者市场的广泛成功对推动开发者市场的需求至关重要。事实证明,开发者和企业购买者也是人类。他们看新闻,关注趋势,并尝试消费者产品。无论OpenAI是否有意为之,都从中获益。
- 最明显的是,认知度和品牌认可对于任何企业都至关重要。尽管OpenAI和LLMs在人工智能群体中已经非常知名,但要使其成为广大开发者市场中的品牌名称,还需要ChatGPT。
- “鸿沟”之所以存在的原因之一是早期的多数人群通常是风险规避的,不相信创新者的信号。克服这一问题的一种方法是为他们提供一种轻松体验产品的方式。ChatGPT为早期多数人群中的非技术决策者提供了完美的“免费试用”体验。
- 实现像OpenAI这样的收入增长的更“典型”方式是雇佣一个企业销售团队。事实证明,传统的以销售驱动增长(SLG)方式在像无缝访问体验产品这样的企业常用增长方法方面受益匪浅。企业购买者越来越期望在签订大型合同之前“看到和体验产品的价值”。
结论
我在这篇文章中作为我之前关于机器学习开发工具的帖子的自然续篇,并且注意到MLOps的故事在LLMOps中重复上演。但当我写到LLM是如何跳过鸿沟时,我意识到这些教训可能更具广泛适用性。
对于OpenAI、Anthropic等LLM供应商:我不确定这些公司是否偶然发现了这一战略,但如果有意应用的话,肯定有一些关于如何改进产品开发和市场推广的教训。然而,如果你处于高速增长模式中,就没有太多时间或需要进行优化。
对于LLMOps生态系统中的任何人:我邀请你阅读我之前关于机器学习基础设施的帖子,你将会明白为什么我认为在这个层面上不会有太多价值提取。此外,我相信只有极少数情况下调整LLM实际上是有意义的,但其他人已经对此写了很多。
对于科技初创公司总体来说:我看到了开源初创公司的大规模融资轮,其猜想要么是“托管开源软件+规模化、稳定性和安全性”,要么是“开源核心,我们稍后再考虑盈利”。我相信“跳过鸿沟”的想法在这里是有价值的,并期待来自创始人和投资者的反馈!
本文中表达的观点是我个人的观点,与我的雇主无关。
Clemens是一位具有创业精神的产品领导者,他在过去的8年中致力于将人工智能引入开发者和企业。