探索生成人工智能、基础模型和大型语言模型的世界：概念、工具和趋势

探索生成人工智能、基础模型和大型语言模型的世界

人工智能（AI）在近年来取得了巨大的进展，这主要是由于深度学习的进步推动。随着去年ChatGPT的出现，生成AI世界的流行度随之增加，伴随着许多令人困惑的词汇出现，如基础模型、大型语言模型、GPT-3和GPT-4、PaLM和PaLM 2、LLaMA和LLaMA 2、Falcon、ChatGPT、Bard、Claude 2等等。本文的目的是更好地理解生成AI的概念，探索趋势和工具，并且假设本文对该主题并不是详尽无遗，而是着重于文本内容。

生成AI是人工智能领域的一个子领域，具有逐步增长的发展，尤其是从去年ChatGPT的出现以来。术语生成AI指的是能够生成新内容的深度学习模型，如文本、图像、视频、音频、结构等。

基础模型是一种类型的生成AI，它们以无监督的方式在大量非结构化数据上进行训练，以学习可以适应不同领域的多个任务的通用表示。它们旨在为构建许多不同的AI应用提供基础。与以任务特定数据进行训练的传统AI模型相比，基础模型在性能、效率和可扩展性方面具有优势。

例如，基础模型可以为气候变化目的构建，利用地理空间数据来改进气候研究。另一个例子是为编码开发基础模型，帮助在编写代码时完成代码。

大型语言模型（LLM）是基于文本生成和理解的基础模型的一个子集。它们经过大量文本数据的训练。

好的，给我们一些例子…

GPT-3是由OpenAI于2020年发布的。它有1750亿个参数，并以2048个标记的上下文窗口大小训练了3000亿个标记。 GPT-4于2023年3月发布，是GPT-3的改进版本，具有32768个标记的上下文窗口大小。它是一个多模态模型，可以接受图像和文本输入，并生成文本输出。

PaLM于2022年由Google发布，密集激活，共有5400亿个参数，并以2048个标记的上下文窗口大小训练了7800亿个标记。Google还于2023年5月发布了PaLM 2，它更快、相对较小且具有成本效益，因为它提供了更少的参数，支持超过100种语言，并达到了8000个标记的上下文窗口大小。它不像GPT-4那样是多模态的，但多模态能力已通过Med-PaLM 2添加，仅限于医学领域。

LLaMA由Meta开发，并于2023年2月发布。它的模型参数范围从70亿到650亿，经过万亿标记的训练，从2023年7月开始，可以使用改进版LLaMA 2，其参数达到700亿，上下文窗口大小从2048个标记增加到4096个标记。

Falcon由Technology Innovation Institute（TII）开发，第一个版本于2021年10月发布，模型参数范围从70亿到400亿，从高质量网络数据的1万亿个标记训练而成。可以从Hugging Face下载。

Dolly由Databricks开发，并于2023年3月发布。它的参数大小为120亿个，基于EleutherAI的Pythia模型，并在Databricks员工生成的15000条记录指令语料库上进行了微调。

所有这些LLM都使用基于Transformer的模型来预测文档中的下一个标记，显然它们的架构有一些差异。

您可以探索Hugging Face排行榜，目的是跟踪、排名和评估发布的开放LLM和聊天机器人。

这些模型代表了生成AI工具（如ChatGPT）构建的引擎。如果我们将其与汽车进行比较，LLM就是汽车的引擎。同时，聊天机器人代表车身。

ChatGPT是OpenAI于2022年11月推出的第一个生成式人工智能聊天机器人，它是通过强化学习来自人类反馈进行微调的GPT-3.5或GPT-4大型语言模型。它可以以对话的方式进行聊天，支持回答问题、撰写摘要、调试代码、生成文本等多种任务。

Bard是Google开发的OpenAI的ChatGPT竞争对手，于2023年2月发布。它最初基于LaMDA大型语言模型，后来由PaLM 2提供支持。它的工作方式与ChatGPT相似，能够理解和生成多种语言的文本，不同之处在于它实时更新，意味着它可以从网络中获取信息，提供更准确、高质量的答案。

h2oGPT属于H2O.ai平台开发的新一代聊天机器人，支持多种模型：GPT 3.5 Turbo，LLaMA 2，Falcon等。您可以在线或本地使用它，它还具有烘焙UI模式，可以同时比较不同模型的输出。

Claude 2由Anthropic开发，它的工作方式类似于ChatGPT，能够理解和生成文本，并实时更新提供无害的回应，它是ChatGPT和Bard的有希望的竞争对手。

鉴于ChatGPT的工作方式以及它在提高生产力方面的实际用途，它不仅仅是一时的潮流，而且是一个有机会在未来几年中发展的业务。因此，谷歌已经投资了Bard，其他公司也决定进入市场，如前面提到的聊天机器人和其他生成式人工智能工具。

下图显示了ChatGPT与Bard以及之前提到的其他聊天机器人在过去30天内在全球的趋势兴趣。

Claude 2和h2oGPT有一定程度的兴趣重叠，所以竞争是在ChatGPT和Google Bard之间，前者明显占据优势，目前差距很大。

从一年的时间窗口来看，ChatGPT在2023年春季达到了兴趣的最高水平，现在只是有所下降。

从这两张图片和下一张图片来看，我心中的问题是：“在未来的几个月或几年里，ChatGPT的竞争优势会被侵蚀吗？或者由于ChatGPT最先进入市场，它已经巩固了自己作为用户的永久工具，就像与其他搜索工具相比的Google搜索一样？”

享受您最喜欢的生成式人工智能聊天机器人吧。

Bard Ai,ChatGPT,Foundation Models,Generative Ai Tools,Large Language Models

探索生成人工智能、基础模型和大型语言模型的世界：概念、工具和趋势

探索生成人工智能、基础模型和大型语言模型的世界

现代自然语言处理详细概述. 第2部分 GPTs

用于LLM的思维链提示

数据科学家 vs 数据分析师 vs 数据工程师 R...

谷歌免费的生成式人工智能课程

康奈尔大学的人工智能（AI）研究人员提出了一...

2023年机器学习研究中的顶级数据版本控制工具

中国的研究人员提出了一种基于联邦学习（FL）...

梅奥诊所的AI研究人员引入了一种基于机器学习...

人工智能