谷歌发布其最新的AI模型“双子座”

瞩目！谷歌推出全新AI模型“双子座”

谷歌DeepMind的首席执行官兼联合创始人Demis Hassabis和谷歌的首席执行官Sundar Pichai共同推出了期待已久的AI模型“Gemini”，该模型承诺将重塑人工智能领域的格局。根据该公司的博客文章，Gemini承诺提供先进的功能，可能令OpenAI警觉。

但是Gemini是什么呢？博客中提到，该模型是谷歌团队广泛合作的结果。其多模态设计使其能够无缝地理解和处理各种类型的信息，包括文本、代码、音频、图像和视频。

该模型有三种优化配置：

Gemini Ultra：专为高度复杂的任务而设计，Gemini Ultra是Gemini系列中功能最强大的模型。
Gemini Pro：适用于多种任务的扩展，Gemini Pro提供卓越的性能和灵活性。
Gemini Nano：专为设备上的任务量身定制，Gemini Nano是一个高效的模型，能够在各种应用中保持最佳性能。

那么，性能如何呢？谷歌团队使用Gemini Ultra进行测试，并在Massive Multitask Language Understanding（MMLU）基准测试中超过了人类专家，得分达到了令人印象深刻的90.0%。

此外，Gemini Ultra在全新的Multimodal Multitask Understanding（MMMU）基准测试中取得了59.4%的最新成绩，展示了其在多个领域中的先进推理能力。下面是一个关于它在数学和物理方面推理能力的精彩视频：

但是，谷歌团队表示，Gemini的独特之处在于其本地多模态设计。这种设计与将不同模态的分离组件拼接在一起的常规方法不同。这使得Gemini能够无缝地理解和推理输入，几乎在每个领域中都优于现有的多模态模型。

该模型的多模态推理能力使其能够理解复杂的书面和视觉信息，而其在生成流行编程语言的高质量代码方面的功力使其成为全球编码任务的主要基础模型。

Gemini的可靠性、可扩展性和效率在谷歌的AI优化基础设施上使用Tensor Processing Units（TPUs）v4和v5e进行培训而得到进一步增强。最强大的TPU系统，Cloud TPU v5p的引入将加快Gemini的发展，使开发人员和企业客户能够更快、更高效地训练大规模的AI模型。

谷歌还强调Gemini核心开发中的安全性和责任感。他们在博客中解释说，该模型正在接受迄今为止最全面的谷歌AI模型安全评估。他们的目标是解决潜在风险，包括偏见和有害信息，并征求外部专家的意见来评估该模型。

现在，当然，每个人都想知道何时能够使用Gemini。根据团队的说法，Gemini 1.0将在各种产品和平台上推出，首先是谷歌产品中的Gemini Pro，包括Bard。

从那时起，用户可以期待到更加出色的体验，Gemini将被整合到更多谷歌服务中，包括搜索、广告、Chrome和Duet AI。开发人员和企业客户可以从12月13日开始通过Gemini API在谷歌AI Studio或谷歌云Vertex AI中访问Gemini Pro。

Android开发者也将有机会通过Android 14中的AICore利用Gemini Nano的效能。随着Gemini的发布，谷歌似乎正努力在人工智能竞赛中取得领先地位。他们在下面提供了一段关于Gemini的简短介绍视频：

谷歌发布其最新的AI模型“双子座”

瞩目！谷歌推出全新AI模型“双子座”

微软推出鲸鱼2号，打造首款慎重推理LKM

图表、分析和生成AI：图表通讯的一年

与GPS-Gaussian见面：一种以实时方式合成角色...

纽约大学的研究人员提出了GPQA：一项挑战性的...

遇见Vchitect：一款用于文本到视频（T2V）和图...

Adobe 研究人员提出了 DMV3D：一种新颖的 3D ...

为什么理解数据生成过程比数据本身更重要

理解独立性以及在因果推断和因果验证中的重要性

人工智能