忘掉RAG,未来是RAG-Fusion

告别RAG,瞩目RAG-Fusion的时代

搜索的下一个前沿:检索增强生成与互反排名融合和生成的查询

RAG融合的奇妙世界。作者提供的插图。

作为一个已经建立搜索产品近十年的产品经理,我可以坦诚地说,最近检索增强生成(RAG)的崛起是最具破坏性的。这个系统正在使用向量搜索和生成式人工智能革新搜索和信息检索,以基于可信数据生成直接答案。

然而,作为一个最近将RAG产品投入生产环境的产品经理,我认为RAG仍然过于有限,无法满足用户的需求,需要升级。

我个人的搜索系统(Project Ramble),其中我在2022年将我的Obsidian笔记与向量搜索和GPT-3相结合。作者提供的图像。

别误会,RAG非常出色,并且绝对是信息检索技术正确方向上的一大步。自从GPT-2在2021年问世以来,我一直在使用RAG,这极大地提高了我在查找我自己的笔记或工作文档中有价值信息时的效率。RAG有许多优点

  • 向量搜索融合: RAG通过将向量搜索能力与生成模型集成,引入了一种全新的模式。这种融合使得大型语言模型(LLM)可以生成更丰富、更有上下文意识的输出。
  • 减少错误信息: RAG显著降低了语言模型产生错误信息的倾向,使生成的文本更加实际可靠。
  • 个人和专业效用: 无论是个人应用,如整理笔记,还是更多专业集成,RAG展示了提高生产力和内容质量的多样性,并依赖于可信的数据来源。

然而,我发现RAG存在越来越多的局限性

  • 当前搜索技术的限制: RAG受到与我们基于检索的词汇和向量搜索技术相同的限制。
  • 人工搜索的低效率: 人类在将想要的信息写入搜索系统时并不擅长,例如拼写错误、模糊的查询或有限的词汇,这经常导致无法获取更大的信息资源库…