让ChatGPT做姜萍的数学竞赛题:它是愚蠢的,我也是愚蠢的。

06-22 19:37

The following article is from 卡兹克的数字生命 Author 卡兹克的数字生命


本来以为再差也不会那么离谱,好家伙你直接给我这个?


———— / BEGIN / ————


最近有个叫姜萍的小姑娘火了。


不只是因为她进入了 2024 而且,由于她是阿里巴巴全球数学竞赛决赛的入围名单, 17 岁、93 分、全球第 12 名字。而且是前30名中唯一的女孩。


更加爆棚的是,是她的学校。


江苏省涟水中等专业学校。


嗯,中专。


北大、剑桥、清华、清华、MIT、中国科学院等。


这所江苏省涟水中等专业学校,让人十分出戏。


并且她主修服装设计。


这个时候,把我的人看得都麻木了。


今年是阿里全球数学竞赛的第六届,而姜萍,也是有史以来第一个进入决赛的中专学生。


网上铺天盖地,关于她的讨论太多了。无论如何,在这里,先把膝盖献给小女孩。我希望她能越走越远,爬上她理想的高峰。


同时也让我对另一点很好奇,2024 阿里巴巴全球数学竞赛,这是一场什么比赛?


接着我去查资料和题目。


才发现原来是马爸爸。 2018 2008年开始的比赛,随后阿里巴巴公益、达摩院将其打造成当今世界上规模最大的在线数学竞赛。


而且最有趣的是,今年的比赛,有一点非常创新,那就是支持, AI 团队参赛。


然后有 563 支 AI 队伍冲进去,但没有一个入选。得分最高 34 分,跟人类第一 113 分差相当远,与姜萍相比。 93 分数也有很大的距离。


看了一下 AI 小组名单,第一名是高中生,第二名是老熟人,特工宇宙。


但他们都采用了许多工程技术。


突然间,我对这次数学竞赛的题目感兴趣,只想看看题目有多难。


接着我把考题翻了出来。


第 1 题:


看到这个问题,我觉得自己刚才说话有点大声。


脑子里就在幻视这个小同学独闯迷踪阵,有一个 6 一个桩,小同学迷失在迷踪中,缓过神来发现怎么只有四个桩。不是问桩在哪里,而是问有多少小同学… ...


但没关系,我有 AI,所以我什么也没加 Prompt 和 Agent,就这样直接把这张图丢了 ChatGPT。


总而言之,看了一顿很厉害的导出之后,GG 了。


答案是 6,你整个 复制者12,对吗?


老师告诉我们,考试的时候不要在第一题上浪费太多时间。然后冷静地看第二个问题。


第 2 题:


我:好啊!这个问题我会,战机游戏!AABB 上上下下!完成了。


对于 ChatGPT,他让我想起了那首歌,《全选》 C》。


全部错误,答案是 B 和 A。


第三个问题是人类和人工智能的选择。


第 3 题:


我:这怎么会有立体效果?没有,那个 Z,怎样镂空?数学试卷开始使用 Windows 艺术词汇?整篇文章我看见一个浓密的,让我的大脑变得浓密。


ChatGPT:


有相当多的小字,一堆我看不懂的东西向上打招呼。虽然看不懂公式,但至少能看懂不同的音调。你的公式都和答案不一样。


第 4 题:


我:是谁?!是谁释放了我的大脑空咒… ...


对于 ChatGPT... 算了,它认怂了。


第 5 题:


我:多年的经验告诉我,字少事大。


果不其然,定睛一看,那个 R,又特别是艺术字。


没有,答案里显然有很多这样的小音符。


那么问题来了,ChatGPT,你们的小音符呢?没有小音符,你敢说你是对的吗?


第 6 题:


我:好家伙终于认识了!五福我熟悉啊,每年的福卡我都会收集起来。


勉强蒙对 1/2,但整个过程是错误的。


的确纯粹靠蒙。


继续错误的第二个问题。


最后,来到最后一个问题。


第 7 题:


我:啊?


你们给我阅读理解吗?


你们不是音乐,不是小红和小绿吗?难道不是一起去树下,搞笑树下的搞笑果实,搞笑树下的你和我?


对于 ChatGPT...


洗洗睡吧。


最后 ChatGPT 评分:0 分。


在看完了 7 之后,此时此刻我的脑海里只有一句话:我在做什么?


估计 ChatGPT 还是很傻,不知道为什么我要这样摧毁它。


必须说,能参加这样的比赛,能在这样的比赛中证明自己,都是大神。


从上面我和 ChatGPT 一人一模式互相扶着跌跌撞撞走过来的经历,现有的 AI 距离高数的推理学习,还有很长的路要走。


但这并不意味着大型模型将被控制在数学领域的中学水平。作为一种工具,它更依赖于人类的实践。


如同今年 1 月登上 Nature 谷歌爆裂级研究 DeepMind 的 AlphaGeometry,在 30 在问题范围内,可以回答。 25 人类金牌获得者平均水平解决了道国际数学奥林匹克几何问题 25.9 个问题。


它已成为人类奥数的金牌级别。


而且这个胜利的背后,是 AlphaGeometry 该团队构建了神经语言模型和符号演绎引擎两个系统,试图提高模型推导能力。


这是 AlphaGeometry 成就,这更是人类优越的成就。


做出理性的决策和判断,同时具有丰富的情感和直觉感知。


然而,这类事情,离普通人肯定还有很长的路要走,但我们也有自己的小期望。


例如,GPT-5。


之前 Sam Altman 然后放出话来,GPT-5 将在高级推理功能上取得重大进展。


我很相信,OpenAI 至少不会在 GPT 在这个核心模型上,和我们打嘴炮。


纵使现在的 AI 仍然需要成长,但是,攀登者从不害怕成长。


正如姜萍对数学的向往一样,正如我之前和大家分享的那些,因为喜欢而凌云登峰的可敬者。


所以,最后的问题来了:GPT-到底什么时候才能出来?


作者:数字生命卡兹克克


来源微信微信官方账号:数字生命卡兹克(ID:Rockhazix)


题图来自 Unsplash ,基于 CC0 协议


品牌推广| 内容编写|广告营销|培训合作


请到微信官方账号后台回复


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com