让ChatGPT做姜萍的数学竞赛题：它是愚蠢的，我也是愚蠢的。

2024-06-22

The following article is from 卡兹克的数字生命 Author 卡兹克的数字生命

本来以为再差也不会那么离谱，好家伙你直接给我这个？

———— / BEGIN / ————

最近有个叫姜萍的小姑娘火了。

不只是因为她进入了 2024 而且，由于她是阿里巴巴全球数学竞赛决赛的入围名单， 17 岁、93 分、全球第 12 名字。而且是前30名中唯一的女孩。

更加爆棚的是，是她的学校。

江苏省涟水中等专业学校。

嗯，中专。

北大、剑桥、清华、清华、MIT、中国科学院等。

这所江苏省涟水中等专业学校，让人十分出戏。

并且她主修服装设计。

这个时候，把我的人看得都麻木了。

今年是阿里全球数学竞赛的第六届，而姜萍，也是有史以来第一个进入决赛的中专学生。

网上铺天盖地，关于她的讨论太多了。无论如何，在这里，先把膝盖献给小女孩。我希望她能越走越远，爬上她理想的高峰。

同时也让我对另一点很好奇，2024 阿里巴巴全球数学竞赛，这是一场什么比赛？

接着我去查资料和题目。

才发现原来是马爸爸。 2018 2008年开始的比赛，随后阿里巴巴公益、达摩院将其打造成当今世界上规模最大的在线数学竞赛。

而且最有趣的是，今年的比赛，有一点非常创新，那就是支持， AI 团队参赛。

然后有 563 支 AI 队伍冲进去，但没有一个入选。得分最高 34 分，跟人类第一 113 分差相当远，与姜萍相比。 93 分数也有很大的距离。

看了一下 AI 小组名单，第一名是高中生，第二名是老熟人，特工宇宙。

但他们都采用了许多工程技术。

突然间，我对这次数学竞赛的题目感兴趣，只想看看题目有多难。

接着我把考题翻了出来。

第 1 题：

看到这个问题，我觉得自己刚才说话有点大声。

脑子里就在幻视这个小同学独闯迷踪阵，有一个 6 一个桩，小同学迷失在迷踪中，缓过神来发现怎么只有四个桩。不是问桩在哪里，而是问有多少小同学… ...

但没关系，我有 AI，所以我什么也没加 Prompt 和 Agent，就这样直接把这张图丢了 ChatGPT。

总而言之，看了一顿很厉害的导出之后，GG 了。

答案是 6，你整个复制者12，对吗？

老师告诉我们，考试的时候不要在第一题上浪费太多时间。然后冷静地看第二个问题。

第 2 题：

我：好啊！这个问题我会，战机游戏！AABB 上上下下！完成了。

对于 ChatGPT，他让我想起了那首歌，《全选》 C》。

全部错误，答案是 B 和 A。

第三个问题是人类和人工智能的选择。

第 3 题：

我：这怎么会有立体效果？没有，那个 Z，怎样镂空？数学试卷开始使用 Windows 艺术词汇？整篇文章我看见一个浓密的，让我的大脑变得浓密。

ChatGPT：

有相当多的小字，一堆我看不懂的东西向上打招呼。虽然看不懂公式，但至少能看懂不同的音调。你的公式都和答案不一样。

第 4 题：

我：是谁？！是谁释放了我的大脑空咒… ...

对于 ChatGPT... 算了，它认怂了。

第 5 题：

我：多年的经验告诉我，字少事大。

果不其然，定睛一看，那个 R，又特别是艺术字。

没有，答案里显然有很多这样的小音符。

那么问题来了，ChatGPT，你们的小音符呢？没有小音符，你敢说你是对的吗？

第 6 题：

我：好家伙终于认识了！五福我熟悉啊，每年的福卡我都会收集起来。

勉强蒙对 1/2，但整个过程是错误的。

的确纯粹靠蒙。

继续错误的第二个问题。

最后，来到最后一个问题。

第 7 题：

我：啊？

你们给我阅读理解吗？

你们不是音乐，不是小红和小绿吗？难道不是一起去树下，搞笑树下的搞笑果实，搞笑树下的你和我？

对于 ChatGPT...

洗洗睡吧。

最后 ChatGPT 评分：0 分。

在看完了 7 之后，此时此刻我的脑海里只有一句话：我在做什么？

估计 ChatGPT 还是很傻，不知道为什么我要这样摧毁它。

必须说，能参加这样的比赛，能在这样的比赛中证明自己，都是大神。

从上面我和 ChatGPT 一人一模式互相扶着跌跌撞撞走过来的经历，现有的 AI 距离高数的推理学习，还有很长的路要走。

但这并不意味着大型模型将被控制在数学领域的中学水平。作为一种工具，它更依赖于人类的实践。

如同今年 1 月登上 Nature 谷歌爆裂级研究 DeepMind 的 AlphaGeometry，在 30 在问题范围内，可以回答。 25 人类金牌获得者平均水平解决了道国际数学奥林匹克几何问题 25.9 个问题。

它已成为人类奥数的金牌级别。

而且这个胜利的背后，是 AlphaGeometry 该团队构建了神经语言模型和符号演绎引擎两个系统，试图提高模型推导能力。

这是 AlphaGeometry 成就，这更是人类优越的成就。

做出理性的决策和判断，同时具有丰富的情感和直觉感知。

然而，这类事情，离普通人肯定还有很长的路要走，但我们也有自己的小期望。

例如，GPT-5。

之前 Sam Altman 然后放出话来，GPT-5 将在高级推理功能上取得重大进展。

我很相信，OpenAI 至少不会在 GPT 在这个核心模型上，和我们打嘴炮。

纵使现在的 AI 仍然需要成长，但是，攀登者从不害怕成长。

正如姜萍对数学的向往一样，正如我之前和大家分享的那些，因为喜欢而凌云登峰的可敬者。

所以，最后的问题来了：GPT-到底什么时候才能出来？

作者：数字生命卡兹克克

来源微信微信官方账号:数字生命卡兹克（ID：Rockhazix）

题图来自 Unsplash ，基于 CC0 协议

品牌推广｜内容编写｜广告营销｜培训合作

请到微信官方账号后台回复合作

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

并非闪电皮娜没有钱买，而是捷安特TCR SL1更具性价比！

野路子，没有方向，晋升难？一张图带你建立产品经理能力模型

228年来第一次！这个夏至不一般

别捡，别摘！大量出现在宁波街头

年青人用脚，决定了奥康国际的命运。

项目推荐

迪瓜租机

康老板 · 氧疗堂