谷歌DeepMind推出AlphaCode 2:一种利用双子座模型的人工智能系统,在竞技编程卓越方面取得了引人注目的进步

谷歌DeepMind的AlphaCode 2:引人瞩目的竞技编程卓越进展,以双子座模型驱动的人工智能系统

机器学习领域在处理和理解文本数据方面取得了一些令人难以置信的进展。然而,解决问题的新创新仅限于相对简单的算术和编程问题。竞技编程,这是对编程技能进行严格评估的难题,要求参赛者在有限的时间内为复杂问题编写代码解决方案,需要高度的批判性思维、逻辑推理和对算法和编程概念的全面理解。

谷歌 DeepMind 最近发布了 AlphaCode 2,旨在解决智能和推动竞技编程领域的问题。AlphaCode 2 是 AlphaCode 的升级版,它提高了游戏难度并改变了游戏规则。这个基于强大的 Gemini 模型和全面复杂推理和问题解决能力的人工智能(AI)系统,是由 Google 的 Gemini 团队于 2023 年创建的。

团队表示,AlphaCode 2 的架构基于强大的大型语言模型(LLMs)和专为竞技编程设计的高级搜索和重排序系统。它包括一系列生成代码样本的策略模型,一个促进多样性的采样机制,一个去除不符合规范的样本的过滤机制,一个去除冗余的聚类算法和一个选择最佳候选人的评分模型。

过程中的第一步是 Gemini Pro 模型,它是 AlphaCode 2 的基础。通过两轮严格的精细调整,使用 GOLD 训练目标。第一轮集中在一个新版本的 CodeContests 数据集上,其中包含大量问题和人工生成的代码示例,结果产生了一系列经过改进的模型,每个模型都专门用于解决竞技编程中遇到的许多困难。

AlphaCode 2 采用了全面和有意的采样策略。系统为每个挑战生成最多一百万个代码样本,并通过随机分配温度参数来促进多样性。在 AlphaCode 2 的帮助下,使用高质量的 C++ 样本。

在 Codeforces 平台上进行的最新测试中,AlphaCode 2 展示了其能力,仅经过十次尝试就能解答让人惊叹的 43% 的问题。与先前版本 AlphaCode 处理相似情况下 25% 的问题相比,这是一个重大的进步。AlphaCode 2 目前的平均位于第 85 个百分位数,超过了中位数对手,并在之前被认为是 AI 系统能力之外的水平进行运行。

总之,AlphaCode 2 是竞技编程领域的一个令人难以置信的发展,它展示了如何使用 AI 系统来解决具有挑战性和开放性的问题。该系统的成就代表了技术上的突破,并为人类和 AI 程序员共同努力推动编程界限提供了机会。