探索生成人工智能、基础模型和大型语言模型的世界:概念、工具和趋势
探索生成人工智能、基础模型和大型语言模型的世界
人工智能(AI)在近年来取得了巨大的进展,这主要是由于深度学习的进步推动。随着去年ChatGPT的出现,生成AI世界的流行度随之增加,伴随着许多令人困惑的词汇出现,如基础模型、大型语言模型、GPT-3和GPT-4、PaLM和PaLM 2、LLaMA和LLaMA 2、Falcon、ChatGPT、Bard、Claude 2等等。本文的目的是更好地理解生成AI的概念,探索趋势和工具,并且假设本文对该主题并不是详尽无遗,而是着重于文本内容。
生成AI是人工智能领域的一个子领域,具有逐步增长的发展,尤其是从去年ChatGPT的出现以来。术语生成AI指的是能够生成新内容的深度学习模型,如文本、图像、视频、音频、结构等。
基础模型是一种类型的生成AI,它们以无监督的方式在大量非结构化数据上进行训练,以学习可以适应不同领域的多个任务的通用表示。它们旨在为构建许多不同的AI应用提供基础。与以任务特定数据进行训练的传统AI模型相比,基础模型在性能、效率和可扩展性方面具有优势。
例如,基础模型可以为气候变化目的构建,利用地理空间数据来改进气候研究。另一个例子是为编码开发基础模型,帮助在编写代码时完成代码。
大型语言模型(LLM)是基于文本生成和理解的基础模型的一个子集。它们经过大量文本数据的训练。
好的,给我们一些例子…
GPT-3是由OpenAI于2020年发布的。它有1750亿个参数,并以2048个标记的上下文窗口大小训练了3000亿个标记。 GPT-4于2023年3月发布,是GPT-3的改进版本,具有32768个标记的上下文窗口大小。它是一个多模态模型,可以接受图像和文本输入,并生成文本输出。
PaLM于2022年由Google发布,密集激活,共有5400亿个参数,并以2048个标记的上下文窗口大小训练了7800亿个标记。Google还于2023年5月发布了PaLM 2,它更快、相对较小且具有成本效益,因为它提供了更少的参数,支持超过100种语言,并达到了8000个标记的上下文窗口大小。它不像GPT-4那样是多模态的,但多模态能力已通过Med-PaLM 2添加,仅限于医学领域。
LLaMA由Meta开发,并于2023年2月发布。它的模型参数范围从70亿到650亿,经过万亿标记的训练,从2023年7月开始,可以使用改进版LLaMA 2,其参数达到700亿,上下文窗口大小从2048个标记增加到4096个标记。
Falcon由Technology Innovation Institute(TII)开发,第一个版本于2021年10月发布,模型参数范围从70亿到400亿,从高质量网络数据的1万亿个标记训练而成。可以从Hugging Face下载。
Dolly由Databricks开发,并于2023年3月发布。它的参数大小为120亿个,基于EleutherAI的Pythia模型,并在Databricks员工生成的15000条记录指令语料库上进行了微调。
所有这些LLM都使用基于Transformer的模型来预测文档中的下一个标记,显然它们的架构有一些差异。
您可以探索Hugging Face排行榜,目的是跟踪、排名和评估发布的开放LLM和聊天机器人。
这些模型代表了生成AI工具(如ChatGPT)构建的引擎。如果我们将其与汽车进行比较,LLM就是汽车的引擎。同时,聊天机器人代表车身。
ChatGPT是OpenAI于2022年11月推出的第一个生成式人工智能聊天机器人,它是通过强化学习来自人类反馈进行微调的GPT-3.5或GPT-4大型语言模型。它可以以对话的方式进行聊天,支持回答问题、撰写摘要、调试代码、生成文本等多种任务。
Bard是Google开发的OpenAI的ChatGPT竞争对手,于2023年2月发布。它最初基于LaMDA大型语言模型,后来由PaLM 2提供支持。它的工作方式与ChatGPT相似,能够理解和生成多种语言的文本,不同之处在于它实时更新,意味着它可以从网络中获取信息,提供更准确、高质量的答案。
h2oGPT属于H2O.ai平台开发的新一代聊天机器人,支持多种模型:GPT 3.5 Turbo,LLaMA 2,Falcon等。您可以在线或本地使用它,它还具有烘焙UI模式,可以同时比较不同模型的输出。
Claude 2由Anthropic开发,它的工作方式类似于ChatGPT,能够理解和生成文本,并实时更新提供无害的回应,它是ChatGPT和Bard的有希望的竞争对手。
鉴于ChatGPT的工作方式以及它在提高生产力方面的实际用途,它不仅仅是一时的潮流,而且是一个有机会在未来几年中发展的业务。因此,谷歌已经投资了Bard,其他公司也决定进入市场,如前面提到的聊天机器人和其他生成式人工智能工具。
下图显示了ChatGPT与Bard以及之前提到的其他聊天机器人在过去30天内在全球的趋势兴趣。
Claude 2和h2oGPT有一定程度的兴趣重叠,所以竞争是在ChatGPT和Google Bard之间,前者明显占据优势,目前差距很大。
从一年的时间窗口来看,ChatGPT在2023年春季达到了兴趣的最高水平,现在只是有所下降。
从这两张图片和下一张图片来看,我心中的问题是:“在未来的几个月或几年里,ChatGPT的竞争优势会被侵蚀吗?或者由于ChatGPT最先进入市场,它已经巩固了自己作为用户的永久工具,就像与其他搜索工具相比的Google搜索一样?”
享受您最喜欢的生成式人工智能聊天机器人吧。