ChatGPT做不出小学数学题？3大反常识研究结果令人意外

日期：2024-12-26 作者：b598648 移动：http://oml01z.riyuangf.com/mobile/quote/42308.html

原创 Serena 谷雨星球

大家好，我是Serena。

在 AI 每天都突飞猛进的当下，有一部分人工智能领域的专家、学者也发起了一项有趣挑战：

https://imo-grand-challenge.github.io/

要知道，能拿到 IMO 的学生都代表着这一代学生里最聪明的数学大脑，也是通往数学诺贝尔奖「菲尔茨奖」的阶梯。

国外热心网友大多数认为「AI可以在2028年拿到IMO金牌」，然而挑战的发起人之一、来自开发了 ChatGPT 的OpenAI团队的Daniel Selsam谨慎地表示：

身为普通家长，我更关心的还有：

既然难题解不出，那些AI 能做出的基本数学题，孩子还需要花大量时间背诵、或练习基础数学题吗？

在 STEM 教育成风的今天，是不是学习编程和机器人，比学习数学更重要呢？

AI没那么擅长数学

如果你家孩子也认为，「学数学不用做基础练习，反正未来由AI工具来帮忙」，那么下面的事实，可能要让他失望了——

对于最懂数学的人，AI是最好用的工具；

美国亚利桑那州立大学的副教授Shakarian，刚刚在2023年1月初用1000个数学问题对ChatGPT进行了测试，结果发现准确率只有60%，低于一般中学生的准确率。

另外，牛津大学机器学习研究员Simon Frieder，曾在一项研究中让ChatGPT做了一系列数学任务，包括简单的计算、数学证明题、搜索数学文献和奥数题。

结果也发现，ChatGPT在大多数任务上表现为「不及格」。

最具迷惑性的是，哪怕ChatGPT不会做数学题，也会非常「迷之自信」地给出看起来权威的错误答案。

美国德克萨斯大学教授保罗·冯·希佩尔，从事数据科学和统计学研究，他曾用毕达哥拉斯原理考验了ChatGPT，就得到了看似正确、实则错得一塌糊涂的答案。

除非你有专业的数学知识，否则一定会被它带跑偏」。

是的，目前版本的ChatGPT可以从表面上谈论数学，但从没真正深入地「理解」数学的基础知识。

人工智能，就像计算器和计算机一样，最终可能对那些已经非常了解某个领域的人最有用：他们知道要问的问题，如何找出缺点，以及如何检验答案。

换句话说，这是一种工具，只适用于那些最懂数学的人，而不是最不了解数学的人。

目前，已经有很多研究AI的专家、学者在提醒老师、家长和孩子：「在借鉴ChatGPT给出的答案之前，一定要加以验证，不要过于依赖它。」

AI 时代先别急着学STEM

从去年年底ChatGPT彻底大火以后，很多家长看到「机器学习」的风口那么火爆，就觉得自己的孩子一定要掌握编程，成为可以驾驭AI的人。

但另一个反常识的事实是：要成为未来AI时代的主人，比编程更重要的，其实是数学。

到了高年级，很多孩子学不会数学，就是没有掌握确切数学的抽象化思维能力——

如「3个苹果加2个梨总共有几个水果」，抽象成「3+2=5」的能力（到了高中，这个抽象过程会更加复杂、繁琐）。

在一篇2022年的数学期刊中说：「学生的数学抽象能力的水平不仅是学好高中知识的一个重要标志，更是发展创造性思维的前提」。

进入中学阶段，学生是否拥有从具体到抽象化的能力，才能理解更高阶的数学、物理知识，才是学好 STEM 的底层逻辑。

来看一名美国的AI研究员Jason Dsouza给出的一张「人工智能数学能力图谱」（下滑查看）：

所以，AI时代的底层制胜能力，还得从数学中获得。

正如这位AI研究员所说：

记忆和练习仍很重要

在 AI 时代，孩子熟练记忆和掌握数学的能力仍至关重要。

谷雨认识的一位老师在自己公众号写得非常详细。

有孩子被要求背诵九九乘法表和常用的加法组合在于将来接触多位数算术、分数和长除法的时候，能迅速调取知识，提高运算速度和正确率。

对于这种「熟练记忆数学知识」，目前的争论是：AI时代什么都能以0.1秒的速度搜索到，还有必要背诵吗？

例如理解如何构建多步骤的文字问题、建立解决方案模型或解决方程组问题。如果基本的算术都难倒了学生，他们就很难去应对这些复杂的问题。

此外，能够自动回忆数学事实对于乘法尤为重要：如果学生没有将乘法口诀表存储在长期记忆中，他们在乘法运算中就没有足够快速的备用策略来依赖，学生进行乘法运算的速度和效率将受到影响。

对此，哥伦比亚大学教育学院的心理学和教育学教授罗伯特·西格勒（Robert Siegler）表示：

研究还发现，这些事实的熟练程度与后期学习的进步有关；尤其是乘法与分数的学习成功密切相关，而分数恰恰是许多年轻学生常常困惑的地方。

十分有意思的是，像乘法口诀，以及关于钱币、时间、距离等单位的换算，如果熟练地背诵下来，小学生都可以很好地完成相关题目，而AI却可能做不到。

纽约大学教授戴维斯，曾经让AI做了一道题：

乔治有七便士、一角硬币和四分之三硬币。哈丽特有四个便士和四个25美分硬币。首先，乔治原封不动地给了哈丽特三十一美分；然后哈丽特正好把一半的便士还给了他。乔治现在有多少钱？

AI的表现十分不佳。因为它不具备基本的数学技能，难以识别人话背后的数学信息，不了解人类世界的常识性知识。

而这三点，恰恰是人类不费吹灰之力就能习得，并熟练运用的。至少在AI数学能力进步缓慢的今天，这是我们珍贵的数学优势。

哈佛大学认知心理学博士、弗吉尼亚大学教授Daniel T. Willingham，长期关注将认知科学应用到 K12 领域，在豆瓣评分 9.3 分神作，从脑科学的维度给了我们新的启发：

数学练习少的孩子，往往只看到了「表面知识」，看不到知识之前的内在深层联系，做过的题目换一种变体就不会了，遇到更加抽象的高阶知识，大脑就「死机」。

若难以发现其中的深层结构，与发展创新性思维更是越走越远。

同时，牛津大学机器学习研究员Simon Frieder发现，哪怕ChatGPT在解题方面表现不好，但作为数学知识库，它的表现特别出色。

它可以作为一个强大的数学搜索引擎，可以帮助孩子对陌生的数学概念、事实性知识有快速初步的理解，对于高年级需要在数学上往前自学的孩子，特别有用。

至于AI不擅长的计算、推演和将具象信息转化为抽象符号，就需要孩子们放弃「用AI代劳」的想法，踏踏实实通过训练来提升。

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

点赞 0举报收藏 0评论 0

0 条相关评论

相关最新动态

推荐最新动态

点击排行