ChatGPT新对手 谷歌的Gemini

ChatGPT迎来新竞争 对手谷歌的Gemini

 

一段时间以来,ChatGPT一直备受关注。每个人都在谈论它,很多人都在使用它,可能有什么问题呢?

谷歌一直致力于保持其作为AI公司的声誉,迄今为止他们做得很好。然而,在过去的一年中,OpenAI在ChatGPT方面明显领先,而谷歌再次努力取得领先地位只是迟早的事。

首席执行官Sundar Pichai表示:

我们从一开始就对人工智能感兴趣的原因之一是我们一直将自己的任务视为一项历久弥新的任务。

 

这就是谷歌的新成员Gemini

如果你还没有看过它的预告片,我建议你在这里观看。

 

什么是Gemini?

 

Gemini是谷歌最大的语言模型,Pichai首席执行官最初在六月份的一次会议上首次测试,并且现在正式向公众发布。那么,Gemini有何了不起之处,为什么会让ChatGPT感到不安呢?

Gemini并不仅仅是一个单独的人工智能模型。它有不同的变体以满足不同的需求。例如,你有较轻的版本叫做Gemini Nano,它可以运行在Android设备上。还有使用Barb系统框架的Gemini Pro,将用于支持谷歌的许多人工智能服务。

然而,事情并不止于此。还有Gemini Ultra,这是谷歌最强大的模型,也是最强大的LLM。Gemini Ultra似乎专门为数据中心和企业应用而设计。

让我们快速了解一下:

  • Gemini Ultra – 用于高度复杂任务的最大和最强大模型。
  • Gemini Pro – 适用于广泛任务范围的最佳模型。
  • Gemini Nano – 设备上任务的最高效模型。

这个包含3个变种的大型语言模型系列已经被构建用于理解和处理不同类型的信息。该LLM可以处理文本、代码、图像、音频和视频等不同类型的信息。最佳的多模态工具。

那么它有多厉害呢?

 

Gemini的性能

 

谷歌一直在进行大量的工作,测试Gemini模型以确保其符合要求,并经过了各种任务的严格评估。据说谷歌的Gemini Ultra在LLM研究中超越了当前32个广泛使用的学术基准中的30个,得分惊人的90.0%。

  

据称,Gemini Ultra是第一个在大规模多任务语言理解(MMLU)上胜过人类专家的模型。MMLU涵盖了57个学科,包括数学、历史、法律、医学、物理等,以测试世界知识以及解决问题的能力。

从这些基准测试中,我们可以看出Gemini最大的优势是其理解和交互视频和音频的能力。

我们已经看到OpenAI通过创建DALL-E和Whisper来实现这一目标。然而,谷歌从一开始就采用了多感觉模型。谷歌还提到了在编码方面的改进,它使用了一个叫做AlphaCode 2的新代码生成系统,据说比其他编码竞赛参与者的表现提高了85%。

说到这一点,基准只是基准。当普通用户与Gemini互动时,我们才能完全了解其全部功能。

如果您想了解更多关于Gemini的功能,请观看此视频:

如何使用Gemini

对于Pixel 8 Pro用户,您可能已经看到了一些新功能,比如Recorder应用中的自动摘要功能,以及Gboard键盘的智能回复功能,这要归功于Gemini Nano。

如果您渴望尝试Gemini Pro,现在可以通过Bard来实现。开发人员和企业客户还可以从12月13日起通过Google云端的Generative AI Studio或Vertex AI访问Gemini Pro。

如果您对Gemini Nano感兴趣,可能需要等待更长时间,因为它将在明年推出。

值得注意的是,Gemini目前仅提供英文版本。根据公司首席执行官Pichai的说法,将有更多语言可用,公司计划将该模型整合到Google的搜索引擎、广告产品、Chrome浏览器等中。

总结

这看起来是Google重新夺回霸权并展示他们为什么处于AI创新的前沿时刻。您认为接下来会发生什么呢?

****[Nisha Arya](https://www.linkedin.com/in/nisha-arya-ahmed/)****是一位数据科学家兼自由技术作家。她对提供数据科学职业建议或教程以及围绕数据科学的理论知识特别感兴趣。她还希望探索人工智能在延长人类寿命方面的不同方式。作为一个热心学习者,她希望拓宽自己的技术知识和写作能力,并帮助指导他人。