人工智能初创公司趋势:来自 Y Combinator 最新批次的洞察

人工智能初创公司趋势:Y Combinator最新批次洞察

正在构建在最新人工智能技术之上的公司有哪些类型

Proxyclick Visitor Management System在Unsplash上的照片

著名的硅谷创业加速器Y Combinator(YC)最近宣布了他们2023年冬季的入选团队,毫不奇怪的是,~31%的初创公司( 269家中的80家)自称具有人工智能标签 。请谨慎对待实际数字,但这一趋势是明显的——利用人工智能的初创公司现在已成为YC团队的一个相当大的部分。

在本文中,我分析了这批初创公司中的20-25家公司,以了解其中一些更大的趋势,特别是那些利用LLMs(大型语言模型)的初创公司。这些趋势涉及他们如何确定问题、解决方案的方法、他们在做什么以及他们方法的潜在风险。

但在我们讨论趋势之前,让我们先从一个一般的框架开始,来思考科技公司(无论大小)如何从人工智能中获得价值。

人工智能价值链

如果你最近一直在关注科技新闻,你会发现关于人工智能的内容爆炸式增长,很难总是理解这些新闻在整体图景中的位置。让我们使用一个简化的框架来思考。

人工智能是一个非常广泛的术语,涵盖了从可以预测事物的回归模型,到可以识别物体的计算机视觉,再到最近的LLMs(大型语言模型)。为了简化讨论,我们将重点放在最近在公众视野中的LLMs上,自OpenAI向公众开放ChatGPT并引发了公司之间的人工智能竞赛后,这一领域受到了关注。

利用人工智能的科技公司通常在以下三个层面之一运营:

  • 基础设施 — 包括硬件提供商(例如制造支持人工智能模型所需的大量计算的NVIDIA GPU)、计算提供商(例如提供云端处理能力的Amazon AWS、Microsoft Azure、Google Cloud)、人工智能模型/算法(例如提供LLMs的OpenAI、Anthropic),以及人工智能平台(例如提供模型训练平台的TensorFlow)
  • 数据平台/工具层 — 包括为人工智能应用程序收集、存储和处理数据的平台(例如提供云端数据仓库的Snowflake、提供统一分析平台的Databricks)
  • 应用层 — 这涵盖了所有利用人工智能进行特定应用的公司(初创公司、中大型科技公司以及非本来就是科技公司的公司)

基于当前市场所处的位置以及过去类似情况的发展(例如云计算市场),基础设施和数据平台层将可能趋于融合,由少数几家具有相对标准化产品的公司主导。例如:

  • 在硬件领域,NVIDIA目前是领导者,凭借其GPU产品(他们的股票在2023年翻了两番),我们还将看到谁能迎头赶上
  • 计算市场已经趋于融合,AWS、Azure和Google Cloud占据了市场的三分之二
  • 在人工智能算法层面,OpenAI以GPT模型崭露头角,但这是一个竞争激烈的市场,有资金雄厚的公司(Google的Deepmind/Google Brain、Facebook Lambda、Anthropic、Stability AI)——如果你想深入了解,可以参考这份分析。这里需要注意两件事情:i)大多数公司都可以访问相同的数据集,如果一家公司获得了新的付费数据集(例如Reddit),竞争对手很可能也会获得同样的访问权限,ii)GPT模型位于算法层,而ChatGPT产品位于应用层(而非算法层)。

在这种趋于标准化的可能路径下,这些层面上运营的公司有两种可能的发展方向:

  1. 第一种发展方向是加强自身产品,跨层面运营,最近的并购活动就是一个明证——数据平台层的数据仓储公司Snowflake最近收购了Neeva,以加强他们的搜索能力,并有可能将LLMs应用于企业,数据平台层的分析平台Databricks收购了AI算法层的MosaicML,以使“生成式人工智能对每个组织都可用,使他们能够使用自己的数据构建、拥有和保护生成式人工智能模型”
  2. 第二种发展方向是向应用层迈进——ChatGPT是一个典型例子。OpenAI的优势在于人工智能算法层,但是随着推出消费者产品,他们现在成为几十年来首个真正的与谷歌搜索竞争的对手。

未来从人工智能和语言模型中解锁的大部分价值将来自应用层,包括通过创办新的创业公司带来的价值,这就带我们来到 Y Combinator。

Y Combinator(YC)的工作方式

关于 YC 的简要背景,然后我们将讨论趋势。大多数 YC 的公司都处于早期阶段 – 52% 的批次只是一个想法,77% 的批次在 YC 之前没有任何收入。

YC 非常挑剔(<2% 的录取率),但主要依靠数量进行工作:

  • 他们在2023年的两个批次中投资了300多家公司,2022年投资了600多家公司
  • 公司获得标准交易(125,000美元的资金占股7%)
  • YC为初创公司提供了许多指导,并为他们提供了包括 YC 校友、投资者等在内的大量人脉资源
  • 因此,为了取得成功,YC 只需要几个巨大的成功案例赚钱(类似于任何天使投资),并且有几个校友取得了巨大的成功

所有这些都是说 – YC 是一个很好的“代表性”列表,可以了解早期阶段的创业公司市场以及借助人工智能获得创业机会的位置。接下来,我们将深入探讨这些重大趋势。

1. 关注特定问题和客户

创业公司针对一组特定客户的专注问题,即较少的“通用”人工智能解决方案。

一个例子是 Yuma.ai,它专注于帮助 Shopify 商家处理客户请求和关注(您可以在此处看到演示)。通过利用大型语言模型(LLMs),Yuma.ai 自动从知识库生成响应。另一个名为 Speedy 的创业公司致力于支持缺乏时间使用生成式人工智能创建营销内容的中小企业(SMB)。Haven的目标是自动化物业经理大约50%的住户互动。OfOne则针对快餐连锁店,帮助他们自动化订单处理流程并提高盈利能力。

在所有这些例子中,都专注于狭窄的问题领域和客户,并在这种上下文中应用 LLMs。

2. 与现有软件的集成

除了只是使用 GPT / LLMs 并通过用户界面公开它们之外,一些创业公司采取了进一步的步骤,即与他们的客户已经使用的现有软件进行集成。

一个典型的例子是 Lightski,它专注于与客户关系管理(CRM)软件(如 Salesforce)集成。他们的目标是使客户能够通过 Slack 发送自然语言消息来更新他们的 CRM,从而消除了浏览各个用户界面的需要。Yuma.ai则提供一个一键安装功能到帮助台软件中,将 LLMs 的能力与客户自己的知识库结合起来,为服务代理生成草稿响应。

这些集成是解锁新的用例的重要推动因素,这些用例是开箱即用的 LLM 应用程序(如 ChatGPT)无法轻松解决的。

3. 与其他人工智能技术结合利用 LLMs

创业公司正在探索通过与计算机视觉和预测等其他人工智能技术结合使用 LLMs 来创建差异化产品。

一个例子是 Automat,他们的客户通过视频演示一个重复的 Chrome 过程,希望自动化。然后,Automat 使用应用于屏幕录像的计算机视觉技术以及人类自然语言输入来创建所需的自动化。另一个名为 Persana AI 的创业公司利用 CRM 数据集成和公开可用数据来预测销售团队的潜在热门线索。然后,他们利用 LLMs 为每个确定的线索起草个性化的外发消息,利用有关个人的可用定制数据(您可以在此处看到演示)。

结合多种技术有助于这些创业公司创建与通用 LLM 应用程序不同的壕沟和差异化。

4. LLMs 的定制化

许多创业公司根据用户过去的数据和语言风格提供定制选项,以定制客户使用的 LLM 模型。

例如,Speedy 是一个帮助 SMBs 生成营销内容的平台,他们与客户一起进行品牌工作坊。从这些工作坊中收集的见解然后被输入到他们的模型中,使 Speedy 能够捕捉并融入每个企业的独特声音和品牌身份到生成的内容中。类似地,Yuma.ai 关注于从先前的帮助台工单中学习写作风格。通过分析这些互动中使用的模式和语言,Yuma.ai 能够生成与已确定的风格一致的草稿响应,确保客户沟通的一致性和个性化。

5. 创意用户界面

创业公司开始利用的最被低估的杠杆之一是构建独特且有用的用户界面,这是大多数当前LLM产品(例如chatGPT、Bard)不擅长的。当这些界面根据特定用例进行定制时,可以为客户提供大量新的价值,并吸引更多尚未采用现有产品的用户加入,因为使用难度较高。

Type是一个有趣的例子 – 他们构建了一个灵活快速的文档编辑器,让用户在编写时通过按下cmd + k快速调用强大的AI命令。Type的AI能够理解文档的上下文,并随着您的编写提供适应性建议(您可以在此处查看演示)。

另外还有一些有趣的例子,比如Lightski使用Slack作为更新CRM信息的界面,以及Persana AI使用Chrome扩展作为在LinkedIn页面上轻松提供出站草稿的方式。

6. 高信息量、高精度的用例

在这批创业公司中,有一些专注于既需要处理大量信息又需要对发现的见解具有高精度要求的特定用例。

SPRX直接从您的工资单和会计系统中获取数据,计算符合IRS要求的准确的研发税收抵免。

在医疗领域,Fairway Health使用LLMs提高效率,对长篇医疗记录进行分析,以评估患者是否符合特定治疗的条件。这有助于保险公司提高效率,并为消费者创造了更少令人沮丧的体验(您可以在此处查看演示)。

AiFlow使用LLMs从数百份文件中提取引文和数据,帮助私募股权公司进行尽职调查。

7. 针对企业客户的数据隔离,自带数据产品

与消费者不同,企业希望对其数据的使用和共享方式有所控制,包括AI软件提供商。他们希望在一个隔离的环境中,将自己的数据(BYOD)带入基线产品,并定制该产品。

CodeComplete的创意最初是在Meta期间,他们的创始人试图使用GitHub Copilot时被内部拒绝,原因是数据隐私考虑。CodeComplete现在是一款AI编码助手工具,它通过对客户自己的代码库进行调优,提供更相关的建议,并直接部署在本地或客户自己的云平台上。

类似地,对冲基金的AI副驾驶AlphaWatch AI帮助客户使用定制的LLMs,结合外部数据源和安全私有数据。

护城河风险

AI创业公司的大量涌现无疑有助于个人消费者和组织更加高效。这些产品无疑将成为提高生产力和解决问题有效性的巨大突破。

然而,这些创业公司中的一项关键风险是潜在的长期护城河不足。鉴于这些创业公司的阶段和有限的公开信息,很难对此过多解读,但对其长期的防御性很容易找到漏洞。例如:

  • 如果一个创业公司的基础是将基本LLMs(如GPT)与帮助台软件集成,以理解知识库和写作风格,然后生成草稿响应,那么有什么阻止帮助台软件巨头(比如Zendesk、Salesforce)复制这个功能,并将其作为产品套件的一部分提供?
  • 如果一个创业公司正在为文本编辑器构建一个酷炫的界面,以帮助内容生成,那么有什么阻止Google Docs(已在尝试自动起草)和Microsoft Word(已在尝试Copilot工具)复制它?进一步说,有什么阻止他们提供一个质量较差25%的产品,并免费提供给已有产品套件的用户(例如,Microsoft Teams接管Slack的市场份额)?

那些没有护城河的公司仍然可以在其当前形式下取得成功,并且其所做的性质使其成为有吸引力的收购目标,无论是从功能补充还是人才角度来看。然而,对于那些希望将这些初级想法转化为巨大成功的创业公司来说,建立护城河至关重要。

一个明确的方法是构建一个完整的产品,解决一个问题领域,并且在其特性中大量使用AI(而不是作为现有问题领域之上的附加产品)。

举个例子,Pair AI专注于在Tiktok式的格式中帮助创作者构建更具吸引力的课程的问题空间,其中一些AI功能是他们提供的一部分(例如交流式问答)。KURUKURU正在构建一个用于创建漫画的3D引擎,并具有创建角色方面的一些AI功能。

另一种方法是通过同时利用上述趋势中的一些,将产品提供进行加强(从AI功能扩展为解决问题空间的更广泛产品)——数据集成,BYOD模型,启用定制化,与其他AI技术结合。

这是一个快速发展的市场,我们还有很长的路要走,才能看到这些初创公司的发展情况——看到它们在未来几年内如何发展将会很有趣。祝愿YC的W23队伍好运!

感谢您的阅读!如果您喜欢这篇文章,请考虑订阅Unpacked新闻简报,我在那里每周发布关于当前科技和商业主题的深度分析。您也可以在Twitter上关注我 @viggybala。祝好,Viggy。