Algolia首席技术官Sean Mullaney-访谈系列

Algolia首席技术官Sean Mullaney-访谈系列' can be condensed to 'Algolia首席技术官Sean Mullaney访谈系列

Sean Mullaney 是 Algolia 的首席技术官,Algolia 是一家全流程、由人工智能驱动的搜索和发现平台。

Sean 曾在 Stripe 和谷歌担任高管,具有扩展工程组织、开发人工智能驱动的搜索和发现工具以及在全球推动 API 优先解决方案方面的背景。在 Algolia,他负责第二大搜索引擎的技术,每年进行超过 1.5 万亿次搜索。最近,他带领公司推出了 AlgoliaNeuralSearch – 世界上速度最快、可扩展性最强、成本最低的向量和关键字搜索 API。

最初是什么吸引您学习计算机科学的?

我10岁时,我的父母在家里买了我们的第一台电脑。我想做的第一件事就是弄清楚如何编写一款我从一本书中复制出来的文字冒险游戏。几年后,我开始学习 C++,但设计和构建计算机游戏仍然是我作为一个刚开始探索计算机科学的青少年的一个非常大的热情。

您在谷歌工作了 7 年多,在那里帮助构建和领导团队进行战略、运营、大数据和机器学习工作。您最喜欢的项目是什么,从这次经历中学到了什么?

我们找到了如何利用我们拥有的关于广告主如何使用我们产品的大量数据来帮助销售团队。我们编写了自定义规则(后来是更复杂的神经网络),以预测应该在何时使用哪种产品接触哪些客户,以最大程度地提高销售人员的时间产生收入的可能性。在谷歌有超过一百万广告主,这个工具极大地帮助销售团队找到了海量信息中的关键内容。

在最近的 DevBit 总结中,您将 Algolia 的目标描述为使用户能够索引世界并使内容动起来。您能详细说明一下这句话的意思吗?

最终,我们希望帮助客户从他们的数据中获取价值。互联网带来了大量内容和电子商务产品,虽然这是一个重要的里程碑,但是现在可用的信息量非常庞大,因此对于用户来说,找到真正需要的内容变得比以往任何时候都更加困难。然而,当搜索和发现由人工智能驱动时,不断增长的内容列表可以被智能地访问和动态展示,真正帮助用户,而不仅仅使他们感到不知所措。

2022年9月,Search.io 及其专有旗舰产品 NeuralSearch™ 被 Algolia 收购,您能谈一下这个搜索技术的具体内容吗?

简而言之,Algolia NeuralSearch 将关键字匹配与基于向量的自然语言处理(由 LLM 驱动)集成在一个单一的 API 中,这是行业首创。该解决方案采用了我们独有的、首创的神经哈希技术,使向量的使用具有可扩展性,并且成本降低了90% – 这是其他人工智能公司(包括 ChatGPT)所面临的问题。这个突破性产品的真正令人兴奋之处在于,它为企业级组织提供了可扩展的真正人工智能搜索。

新技术还允许零售商等客户了解并提供与通常无法准确或无结果的查询(被视为长尾)匹配的内容。这些查询占当前站点搜索的 55%。作为唯一一个在查询理解、检索和排名方面应用人工智能的全流程搜索解决方案,NeuralSearch 真正理解这些查询,并将被忽视的机会转化为收入。

除了 NeuralSearch™,还有哪些其他的机器学习方法被使用?

我们在三个主要功能上应用了人工智能 – 查询理解、查询检索和结果排名。我们在 Algolia 称之为 AI 搜索三明治:

  • 查询理解:Algolia 的先进自然语言理解(NLU)和基于人工智能的向量搜索提供自由形式的自然语言表达理解和基于人工智能的查询分类,为分析准备和结构化查询。此外,基于用户反馈的自适应学习可以对意图理解进行微调。
  • 检索:然后从最相关到最不相关的结果中检索并排名。检索过程将神经哈希结果与关键字并行使用相同的索引进行简单的检索和排名。这种方法解决了“空结果”问题,并显著提高了点击位置和点击率。在搜索和发现领域,没有其他搜索平台提供这种强大的功能。
  • 排名:最后,Algolia 的基于人工智能的重新排序将最佳结果推送到顶部,考虑了与搜索查询相关的许多信号(包括精确关键字匹配得分、上下文个性化配置文件、项目的流行度、语义匹配得分等),并学习以实现最大的相关性。

此外,随着指数的变化,新产品被添加,新内容被上传,或者术语承担新的含义,由AI驱动的Algolia NeuralSearch产品将会自动学习和调整。它不需要额外的人员或手动操作。它将根据查询或搜索短语自动匹配关键词或概念,可能是两者的混合。这真正实现了搜索的自动化。

Algolia最近将其免费计划从提供10000条记录增加到了100万条记录,这背后的心态是什么,市场对此有何反应?

我们特别选择改进Algolia的定价和打包,以更加开发者友好的方式,引入了两个新的面向开发者的计划:一个免费的“构建”计划和一个提供易扩展性的“增长”计划。新的构建计划将开发者在Algolia中存储的免费记录数量从1万条增加到100万条。这意味着开发者现在可以在Algolia中索引的免费记录数量增加了100倍。此外,Algolia将其增长计划中的搜索请求成本降低了50%,记录成本降低了60%。

我们更新的“构建”定价计划的理念是为开发者提供免费访问其AI驱动的搜索和发现平台的全部功能。当开发者准备扩展他们的应用程序时,“增长”计划为他们提供了更加开发者友好的基于使用情况的定价,适用于实时生产环境。

这里需要注意的一点是,任何设计师、创作者或构建者,无论是偶尔还是全职的软件工程师,都可以快速轻松地访问所有工具、文档、示例代码、教育内容和跨平台集成功能,以开始管理他们的数据、构建搜索前端、配置分析等等,而且全部都是免费的。此外,他们将立即获得一个超过500万构建者的成长中的开发者社区。

能否讨论一下所提供的搜索个性化工具?

Algolia为公司提供了几种搜索个性化工具,以利用数据更好地改进推荐,包括不同类型的推荐和利用数据的独特方式来实际推动这些推荐。

一些示例包括:

  • 热门:推荐其他在流行度方面与客户所进行的搜索相关联的项目。
  • 基于评分:人们希望购买评分最高的产品。
  • 个性化:基于您上次购买的产品、浏览历史、位置或其他因素,我们推荐这些其他产品。

这些数据驱动的方法可以根据客户与产品的互动快速增强和改进结果,因此您更有可能推荐真正转化最佳的产品。

您曾将Algolia描述为全球最可扩展的混合AI搜索引擎。Algolia是如何被设计为如此高效的扩展?

这一切都归功于神经哈希。这一前沿的解决方案可以压缩并大大加快每个查询的速度。计算哈希相似性比标准向量相似性要快得多,并且可以在毫秒内返回结果。

神经哈希对于将AI检索引入各种用例的生产环境来说是一项突破。结合AI驱动的查询处理和重新排序,它承诺在站点搜索中充分释放AI的全部力量。在Algolia的专有突破之前,基于向量的搜索在生产环境中的计算成本太高。

我想重点关注三明治的最重要部分:检索。我们之所以说我们是唯一真正的端到端AI搜索引擎,是因为在搜索行业的幕后一直存在着将AI应用于检索的不懈努力。信息检索是一个非常复杂的过程,而要精通高性能、具有成本效益的大规模AI检索更加复杂。我们通过我们的突破性神经哈希技术来掌握它。这样一来,我们实际上赢得了AI搜索的圣杯。

还有其他关于Algolia的信息需要分享吗?

现在是在Algolia工作的令人兴奋的时刻,我们始终希望与有才华、充满激情的人们开始对话,他们希望加入我们共同打造世界上最好的搜索技术的旅程。如果您符合这个条件,我邀请您访问我们在https://www.algolia.com/careers/上的当前职位空缺。