谷歌Gemini 3.1 Pro Preview:看似微小迭代,为何让姚顺宇直呼“不可阻挡”?

1天前
当OpenAI与Anthropic的掌门人因合作分歧而握拳相对的画面仍被热议时,谷歌悄然完成了一次模型迭代。



这次迭代从版本号看堪称谷歌Gemini系列“最小”的一次——此前是Gemini 2.0到2.5的跨越,此次仅从3.0升级到3.1 Pro Preview。



但这“.1”的升级,进步幅度却远超预期。


谷歌CEO桑达尔·皮查伊(Sundar Pichai)指出,新模型在处理“超级复杂任务”上表现突出,比如复杂概念可视化、数据整合为单一视图,或是将创意项目落地。



姚顺宇也在X平台发文力挺Gemini 3.1 Pro Preview,盛赞:


“Gemini不仅是一款优秀模型,更出色的模型正以不可阻挡之势而来。”



值得注意的是,约一周前谷歌推出了针对科学、研究、工程等复杂开放式问题的“专用推理模式”Gemini 3 Deep Think,这是姚顺宇从Anthropic跳槽至谷歌DeepMind后参与的首个项目。如今的Gemini 3.1 Pro Preview与Gemini 3 Deep Think联系紧密,官方称其“直接基于Gemini 3 Deep Think的经验和技术构建”,相当于将Deep Think的核心推理提升技术“下放”到更广泛可用的Pro模型中。


01


Gemini 3.1 Pro Preview的核心能力


既然新模型的优势在于处理“超级复杂”任务,谷歌官方博文重点展示了以下几类应用场景:


其一,通过简单提示词生成高质量SVG动画。


前代模型虽也具备此功能,但3.1 Pro的进步十分显著。例如提示“生成SVG动画,展现变色龙静坐在树枝上,眼睛随鼠标光标移动”,Gemini 3 Pro生成的动画背景单一、变色龙形象呆板,甚至出现一侧两只眼睛的错误;而3.1 Pro的作品拥有深绿色丛林背景,变色龙带有黄色斑纹与圆点装饰,眼睛立体、腿部姿势自然。



再如提示“生成滑动切换开关SVG,鼠标悬停太阳图标时变为发光月亮,背景从明亮平滑渐变至黑暗,采用简洁扁平UI风格”,Gemini 3 Pro的图标仅为缺角圆形,以黄白区分昼夜;3.1 Pro则呈现黄日白云与月牙繁星的丝滑切换,效果更精致。



简言之,Gemini 3 Pro的动画效果曾被调侃为“学了三年动画”的水平,而3.1 Pro的SVG动画已达到可直接使用的程度。



其二,构建工程级系统。


Gemini 3.1 Pro能依据复杂自然语言指令,生成融合3D渲染、实时太阳星历计算、API异步拉取与物理光效的完整交互系统,而非简单演示页面。例如用户指令生成高保真可交互3D国际空间站轨道追踪器,模型输出了采用高分辨率Blue Marble纹理贴图的精细3D地球模型。



其三,生成交互式创意系统。


谷歌展示了3.1 Pro编写的复杂3D椋鸟群舞模拟,不仅生成视觉代码,还构建了沉浸式体验——用户可通过手部追踪操控鸟群,同时聆听随鸟群运动变化的生成式配乐,为研究人员与设计师提供了原型化感官丰富界面的有力工具。



其四,将文学主题转化为可运行代码。


这是普通人最易感知其强大的能力。当要求为艾米莉·勃朗特《呼啸山庄》打造现代个人作品集网站时,模型并非简单总结文本,而是基于小说氛围与情绪推理,设计出简洁且具当代感的界面,捕捉主人公精神内核。这种抽象推理能力的价值不言而喻。



02


性能究竟有多强?


新模型的性能提升在测试数据中得到充分体现。谷歌官方显示,Gemini 3.1 Pro在ARC-AGI-2基准测试(评估模型解决全新逻辑模式的能力)中验证得分达77.1%,推理性能较3 Pro提升超一倍。



此外,在GPQA Diamond(科学知识测试)中得分94.3%,智能体类基准MCP Atlas得分69.2%,真实网络浏览与信息整合能力基准BrowseComp得分85.9%,均超过Anthropic的Sonnet 4.6、Opus 4.6及OpenAI的GPT-5.2与GPT-5.3-Codex。其在ARC抽象推理和BrowseComp搜索任务上的优势,显示出明显的智能体倾向,而非单纯知识模型。


第三方评测机构也指出,Gemini 3.1 Pro在Artificial Analysis Intelligence Index的10项评测中领先6项,较3 Pro在推理与知识、代码能力及降低幻觉方面进步显著。



同时,3.1 Pro Preview保持较高token效率:运行完整Artificial Analysis Intelligence Index约需5700万token(仅比3 Pro多100万),低于Opus 4.6(max)和GPT-5.2(xhigh)等前沿模型。结合更低的单token定价,其成本优势明显——运行完整Intelligence Index的成本不到Opus 4.6(max)的一半,虽约为开源模型GLM-5的两倍,但综合性能仍具竞争力。


03


能力翻倍,价格不变


谷歌官方API定价显示,Gemini 3 Pro与3.1 Pro Preview收费结构一致:小于200k tokens时,每百万token输入约2美元、输出4美元;大于200k tokens时,输入4美元、输出18美元。上下文缓存方面,按提示词规模每百万token收0.20至0.40美元,另加每小时每百万token4.50美元存储费。


这一定价与上一代3 Pro持平,较Anthropic Opus系列(输入/输出单价约5美元/25美元)更具优势。结合其突出的模型能力,性价比十分可观。目前该版本为“预览版”,正式版即将推出,“.1”的迭代也暗示这只是谷歌的“小试牛刀”。


当前,开发者可在AI Studio、Gemini API、Gemini CLI、Google Antigravity及Android Studio使用3.1 Pro;企业用户可通过Vertex AI和Gemini Enterprise使用;普通用户在Gemini应用和NotebookLM(仅限Pro和Ultra订阅用户)也能体验。


社区中已有不少开发者上手实践,产出诸多惊艳成果:有人用3.1 Pro生成可交互3D机械级汽车悬架系统模拟器,整合机械工程建模、物理逻辑与3D可视化;有人制作“捉鬼猎人走过闹鬼房子”的循环动画,感叹“Gemini所言非虚”。




谷歌此次迭代虽版本号变化微小,却大幅提升了推理与代码能力,且定价稳定。社区的实践热情也印证了其能力与实用性。AI行业竞争已进入“性价比”新阶段,企业与开发者更关注token的投入产出比。谷歌这一步不仅巩固了自身地位,也将竞争推向更注重效率的方向。接下来,Anthropic、OpenAI等竞争对手将如何应对,值得期待。


本文来自微信公众号“字母AI”,作者:小金牙,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com