创纪录!GPT - 5在全球顶尖大赛夺冠,人类居次,北交大团队国内领先
OpenAI、谷歌隔空竞技,双双拿下金牌。
智东西9月18日消息,今天凌晨,OpenAI和谷歌先后宣布,自家模型在全球知名编程竞赛ICPC 2025(第49届国际大学生程序设计竞赛)总决赛中获得金牌级别的成绩。
OpenAI推理系统答对了全部12道题目,其中11道题一次性答对,最难的题目提交9次后成功,与人类团队相比排名第一;Gemini 2.5 Deep Think高级版本在677分钟内解出10道题,与人类团队相比位列第二。
若将AI列入ICPC总排名,前三名依次为OpenAI推理系统、圣彼得堡国立大学、谷歌Gemini 2.5 Deep Think高级版本。


ICPC要求参赛者在5个小时内解出12道复杂算法问题,解题方案的完善程度和解题耗时都会影响积分。
最终,139支队伍中前四名获得金牌,分别是圣彼得堡国立大学、东京大学、北京交通大学、清华大学,其中解出题目最多的是圣彼得堡国立大学,共11道。

ICPC拿下金牌的人类团队
这是继2个月前,OpenAI推理系统、谷歌Gemini 2.5 Deep Think在国际数学奥林匹克竞赛(IMO)之后,再次在顶尖国际竞赛中展现实力。
谷歌Gemini 2.5 Deep Think高级版本参加ICPC总决赛的代码已在GitHub开源。
GitHub地址:
https://github.com/google-deepmind/gemini_icpc2025
01. OpenAI满分夺冠,谷歌稍逊一筹
ICPC是全球历史最悠久、规模最大、最负盛名的大学级算法编程竞赛,每年有近3000所大学、超103个国家的参与者解决现实编程问题。
OpenAI和谷歌均参赛并获金牌级别成绩,OpenAI推理系统解答12道题,谷歌Gemini 2.5 Deep Think高级版本答出10道题,人类最佳团队答出11道题。
1、OpenAI:满分佳绩,11题一次答对
OpenAI推理系统获得满分。

OpenAI表示未专门为ICPC训练模型,而是采用通用推理模型组合参赛。
比赛中,GPT - 5与实验性推理模型共同生成解题方案,由实验性推理模型筛选待提交方案。最终,GPT - 5答对11道题,最难的一道由实验性推理模型解决。
该模型一次性答对11道题,最难问题第9次提交成功。
2、谷歌:答对10题,部分解题超人类
Gemini 2.5 Deep Think高级版本按ICPC规则在远程在线环境比赛,比人类参赛者晚10分钟开始。它共耗时677分钟,解出12题中的10题,其中8题用时45分钟,另2题用时3小时。
下图展示了2025年ICPC总决赛中解决各问题的用时,Gemini用时为蓝色,最快大学生团队用时为灰色。
Gemini在3道题上解题时间超过人类。

ICPC总决赛中解决每个问题所用的时间
此外,谷歌DeepMind称一道难住所有人类团队的难题,被Gemini半小时内解答。
问题C要求设计方案,通过管道网络将液体输送至储液罐,需找到最快注满所有储液罐的管道配置。
该问题有无限种配置可能,因管道可开启、关闭或部分开启,寻找最优配置难度极大。

问题C简介
Gemini找到有效解决方案:先假设每个水库有“优先级值”,代表其与其他水库相比的优先程度。
给定一组优先级值,可用动态规划算法找到管道最佳配置。
Gemini通过极小极大定理,将原问题转化为寻找使最终流量受最大约束的优先级数值。
借助优先级数值与最优流量的关联,在凸性解空间中通过嵌套三分搜索快速找到最优优先级数值,解决了C题。
目前,订阅Google AI Ultra的Gemini用户可在Gemini App中使用轻量级版本的Gemini 2.5 Deep Think。
02. 金牌实力彰显大模型抽象推理力
谷歌DeepMind博客称,Gemini的出色表现得益于预训练、训练后、强化学习技术、多步骤推理和平行思维方面的技术创新。
例如,强化学习中,研究人员训练Gemini为编程难题推理和生成代码,从结果反馈中学习改进。为解决问题,多个Gemini Agent各自提出方案,用终端执行代码测试,再根据尝试迭代方案。
谷歌DeepMind内部研究显示,Gemini 2.5 Deep Think高级版本在2023年和2024年ICPC世界总决赛中也能获金牌级别成绩,表现不逊色于全球前20名竞技开发者。
在ICPC获金牌水平对软件开发有实际影响,若结合比赛中AI和人类的最佳解决方案,12个问题都能完美解决,表明AI可为人类专家提供新思路。
除数学和编程,Gemini 2.5 Deep Think高级版本还展现了抽象推理能力。
因为ICPC问题要求模型理解复杂问题、设计多步骤逻辑计划并完美实施,这与科学和工程领域(如设计新药、微芯片)所需技能相同。
OpenAI研究人员在X上发帖称,用同一组模型参加IMO和IOI竞赛,展示了模型性能和通用性。
03. 大模型解决复杂抽象问题能力提升
从国际数学奥林匹克竞赛到此次编程竞赛,OpenAI和谷歌的模型在解决高难度数学、推理问题上潜力巨大。ICPC全球执行董事Bill Poucher博士表示,ICPC一直追求解决问题的高标准,Gemini的成绩标志着定义下一代AI工具和学术标准的关键节点。
这些在竞争性编程和数学推理方面的突破,证明了大模型在抽象推理问题解决上的性能飞跃,有望与人类专家携手解决更复杂的难题。
本文来自微信公众号“智东西”(ID:zhidxcom),作者:程茜,编辑:李水青,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




