让ChatGPT做姜萍的数学竞赛题:它是愚蠢的,我也是愚蠢的。
The following article is from 卡兹克的数字生命 Author 卡兹克的数字生命
本来以为再差也不会那么离谱,好家伙你直接给我这个?
———— / BEGIN / ————
最近有个叫姜萍的小姑娘火了。
不只是因为她进入了 2024 而且,由于她是阿里巴巴全球数学竞赛决赛的入围名单, 17 岁、93 分、全球第 12 名字。而且是前30名中唯一的女孩。
更加爆棚的是,是她的学校。
江苏省涟水中等专业学校。
嗯,中专。
北大、剑桥、清华、清华、MIT、中国科学院等。
这所江苏省涟水中等专业学校,让人十分出戏。
并且她主修服装设计。
这个时候,把我的人看得都麻木了。
今年是阿里全球数学竞赛的第六届,而姜萍,也是有史以来第一个进入决赛的中专学生。
网上铺天盖地,关于她的讨论太多了。无论如何,在这里,先把膝盖献给小女孩。我希望她能越走越远,爬上她理想的高峰。
同时也让我对另一点很好奇,2024 阿里巴巴全球数学竞赛,这是一场什么比赛?
接着我去查资料和题目。
才发现原来是马爸爸。 2018 2008年开始的比赛,随后阿里巴巴公益、达摩院将其打造成当今世界上规模最大的在线数学竞赛。
而且最有趣的是,今年的比赛,有一点非常创新,那就是支持, AI 团队参赛。
然后有 563 支 AI 队伍冲进去,但没有一个入选。得分最高 34 分,跟人类第一 113 分差相当远,与姜萍相比。 93 分数也有很大的距离。
看了一下 AI 小组名单,第一名是高中生,第二名是老熟人,特工宇宙。
但他们都采用了许多工程技术。
突然间,我对这次数学竞赛的题目感兴趣,只想看看题目有多难。
接着我把考题翻了出来。
第 1 题:
看到这个问题,我觉得自己刚才说话有点大声。
脑子里就在幻视这个小同学独闯迷踪阵,有一个 6 一个桩,小同学迷失在迷踪中,缓过神来发现怎么只有四个桩。不是问桩在哪里,而是问有多少小同学… ...
但没关系,我有 AI,所以我什么也没加 Prompt 和 Agent,就这样直接把这张图丢了 ChatGPT。
总而言之,看了一顿很厉害的导出之后,GG 了。
答案是 6,你整个 复制者12,对吗?
老师告诉我们,考试的时候不要在第一题上浪费太多时间。然后冷静地看第二个问题。
第 2 题:
我:好啊!这个问题我会,战机游戏!AABB 上上下下!完成了。
对于 ChatGPT,他让我想起了那首歌,《全选》 C》。
全部错误,答案是 B 和 A。
第三个问题是人类和人工智能的选择。
第 3 题:
我:这怎么会有立体效果?没有,那个 Z,怎样镂空?数学试卷开始使用 Windows 艺术词汇?整篇文章我看见一个浓密的,让我的大脑变得浓密。
ChatGPT:
有相当多的小字,一堆我看不懂的东西向上打招呼。虽然看不懂公式,但至少能看懂不同的音调。你的公式都和答案不一样。
第 4 题:
我:是谁?!是谁释放了我的大脑空咒… ...
对于 ChatGPT... 算了,它认怂了。
第 5 题:
我:多年的经验告诉我,字少事大。
果不其然,定睛一看,那个 R,又特别是艺术字。
没有,答案里显然有很多这样的小音符。
那么问题来了,ChatGPT,你们的小音符呢?没有小音符,你敢说你是对的吗?
第 6 题:
我:好家伙终于认识了!五福我熟悉啊,每年的福卡我都会收集起来。
勉强蒙对 1/2,但整个过程是错误的。
的确纯粹靠蒙。
继续错误的第二个问题。
最后,来到最后一个问题。
第 7 题:
我:啊?
你们给我阅读理解吗?
你们不是音乐,不是小红和小绿吗?难道不是一起去树下,搞笑树下的搞笑果实,搞笑树下的你和我?
对于 ChatGPT...
洗洗睡吧。
最后 ChatGPT 评分:0 分。
在看完了 7 之后,此时此刻我的脑海里只有一句话:我在做什么?
估计 ChatGPT 还是很傻,不知道为什么我要这样摧毁它。
必须说,能参加这样的比赛,能在这样的比赛中证明自己,都是大神。
从上面我和 ChatGPT 一人一模式互相扶着跌跌撞撞走过来的经历,现有的 AI 距离高数的推理学习,还有很长的路要走。
但这并不意味着大型模型将被控制在数学领域的中学水平。作为一种工具,它更依赖于人类的实践。
如同今年 1 月登上 Nature 谷歌爆裂级研究 DeepMind 的 AlphaGeometry,在 30 在问题范围内,可以回答。 25 人类金牌获得者平均水平解决了道国际数学奥林匹克几何问题 25.9 个问题。
它已成为人类奥数的金牌级别。
而且这个胜利的背后,是 AlphaGeometry 该团队构建了神经语言模型和符号演绎引擎两个系统,试图提高模型推导能力。
这是 AlphaGeometry 成就,这更是人类优越的成就。
做出理性的决策和判断,同时具有丰富的情感和直觉感知。
然而,这类事情,离普通人肯定还有很长的路要走,但我们也有自己的小期望。
例如,GPT-5。
之前 Sam Altman 然后放出话来,GPT-5 将在高级推理功能上取得重大进展。
我很相信,OpenAI 至少不会在 GPT 在这个核心模型上,和我们打嘴炮。
纵使现在的 AI 仍然需要成长,但是,攀登者从不害怕成长。
正如姜萍对数学的向往一样,正如我之前和大家分享的那些,因为喜欢而凌云登峰的可敬者。
所以,最后的问题来了:GPT-到底什么时候才能出来?
作者:数字生命卡兹克克
来源微信微信官方账号:数字生命卡兹克(ID:Rockhazix)
题图来自 Unsplash ,基于 CC0 协议
品牌推广| 内容编写|广告营销|培训合作
请到微信官方账号后台回复 合作
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com