Gemini新模型上线:编程能力全球排名第八,清华姚顺宇参与研发
北京时间周五凌晨,谷歌推出了Gemini 3 Deep Think的重大更新版本。作为专注于复杂任务的推理模式,Deep Think代表着AI领域前沿的最高智能水平,目标是解决科学与工程领域的各类难题。

去年9月加入Google DeepMind的清华物理系传奇人物姚顺宇(Shunyu Yao),也是此次Deep Think新模型的研发参与者之一。

去年,谷歌曾展示过专门开发的Deep Think版本,它能成功应对一些极具挑战性的推理任务,还在数学和编程世界锦标赛中斩获金牌。近期,Deep Think又助力专门研发的智能体开展研究级别的数学探索工作。
经过更新的深度思考模式持续拓展智能边界,在严苛的学术基准测试中创下新纪录,具体包括:
在用于测试现代前沿模型极限的「人类的最后考试」基准测试中,该模型取得了48.4%的全新SOTA成绩(不借助任何工具)。
在ARC-AGI-2测试中获得了84.6%的历史最高分,且该成绩已通过ARC Prize基金会验证。
在包含多种竞技编程挑战的Codeforces平台上,取得了3455 Elo的出色分数。
在2025年国际数学奥林匹克竞赛中达到金牌水平。

新版Gemini 3 Deep Think在ARC-AGI-1测试中的成绩为96.0%,单任务成本7.17美元;在ARC-AGI-2测试中更是达到84.6%的分数,单任务成本13.62美元。

约14个月前,OpenAI的o3-preview模型「高计算」版本在ARC-AGI-1测试中仅获得约88%的分数,单任务成本高达2000至3000美元。而Gemini 3 Deep Think的单任务成本仅7.17美元,成本降低了约280至420倍。
这表明我们需要为AI设计更复杂的测试题目了。
除了在数学和编程竞赛中的优异表现,Gemini 3 Deep Think如今在化学、物理等广泛的科学领域也表现突出。更新后的Deep Think模式在2025年国际物理奥林匹克竞赛和化学奥林匹克竞赛的笔试部分均取得金牌级成绩。它还展现出在高等理论物理方面的能力,在CMT-Benchmark测试中获得50.5%的分数。

尤其值得一提的是它在Codeforces上获得的3455分,这意味着Gemini 3 Deep Think已达到世界排名第八的顶尖竞技程序员水平。此前的最佳成绩是一年多前OpenAI o3取得的2727分,当时排名第175位。
目前全球仅有7人能在编程比赛中战胜Gemini 3 Deep Think。

对于AI及整个科技领域而言,这是一项以往难以想象的成就。
谷歌与科学家和研究人员密切合作,完成了Gemini 3 Deep Think的升级。Deep Think将深厚的科学知识与日常工程实践相结合,突破抽象理论的限制,推动实际应用的发展。
借助更新后的Deep Think,用户可以将草图转化为可3D打印的实体模型。Deep Think会分析图纸,对复杂形状进行建模,并生成用于3D打印的实体文件。

谷歌展示了部分早期测试用户使用最新版Deep Think的成果:
罗格斯大学的数学家Lisa Carbone致力于研究高能物理学所需的数学结构,以填补爱因斯坦引力理论与量子力学之间的鸿沟。由于该领域缺乏大量训练数据,她借助Deep Think技术审阅了一篇高度专业的数学论文。Deep Think成功识别出一个细微的逻辑缺陷,而这个缺陷此前在人工同行评审中均未被发现。
在杜克大学,Haozhe "Harry" Wang带领的实验室利用Deep Think技术优化复杂晶体生长的制备方法,希望发现新的半导体材料。Deep Think成功设计出一种能生长厚度超过100微米薄膜的工艺,达到了以往方法难以实现的精确目标。
或许随着更多用户的使用,我们很快就能基于Gemini 3 Deep Think实现更多科研突破。
全新的Deep Think已在Gemini应用中上线,目前Google AI Ultra订阅用户可使用。此外,谷歌首次通过Gemini API向部分研究人员、工程师和企业开放Deep Think的使用权限。
参考内容:
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/
https://x.com/shaneguML/status/2021999801911718029
本文来自微信公众号“机器之心”,编辑:泽南,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com

