GPT-4能解决数学问题—但并非所有语言都适用

GPT-4解决数学问题的能力—并非所有语言皆可适用

GPT-4在16种不同语言中解决数学问题的几个实验

使用Midjourney创作的图像

导言

据说数学是一种普遍的语言 – 数学概念、定理和定义可以用符号表示,无论语言如何,都可以理解。

在本文中,我测试了GPT-4在十六种不同语言中的数学能力。

早期的实验显示,GPT-4在SAT数学和AP微积分考试以及本科水平的数学上表现出色。然而,这些实验中大部分只有以英语为基础的GPT-4的数学能力受到测试。为了更好地了解GPT-4在英语以外的语言中的数学能力,我用十五种其他语言给它提供了同样的数学问题。

那么,在不同语言中,GPT-4的数学能力有多好?理论上,它应该在所有语言中表现出相同的水平(好坏都一样),但不幸的是(你可能已经猜到了),情况并非如此。GPT-4在解决英语数学问题上要好得多。根据语言的不同,GPT-4可以解决其中一些问题。然而,对于传统上资源匮乏的语言,比如缅甸语和阿姆哈拉语,GPT-4无法解决我给出的问题。

关于Project Euler

我使用Project Euler网站上的数学问题来测试GPT-4。(这也是我今年早些时候使用ChatGPT进行提示工程以解决一些Project Euler问题的回顾之一)。Project Euler以同名数学家而命名,是一个拥有数百个难度不同的数学和计算机编程问题的网站。该网站始于2001年,拥有850多个问题(截至2023年10月),并每周发布一个新问题。

Project Euler问题的好处是每个问题都有一个可以通过数值判断是否“正确”的答案-这使得检查GPT-4的答案是否客观正确变得容易。而且它们往往比高中或大学的数学问题更复杂。目前,对于GPT-4(或其他大型语言模型)的数学能力还没有大规模的全面了解…