谷歌Gemini 3.1 Pro Preview：看似微小迭代，为何让姚顺宇直呼“不可阻挡”？

02-22 06:06

当OpenAI与Anthropic的掌门人因合作分歧而握拳相对的画面仍被热议时，谷歌悄然完成了一次模型迭代。

这次迭代从版本号看堪称谷歌Gemini系列“最小”的一次——此前是Gemini 2.0到2.5的跨越，此次仅从3.0升级到3.1 Pro Preview。

但这“.1”的升级，进步幅度却远超预期。

谷歌CEO桑达尔·皮查伊（Sundar Pichai）指出，新模型在处理“超级复杂任务”上表现突出，比如复杂概念可视化、数据整合为单一视图，或是将创意项目落地。

姚顺宇也在X平台发文力挺Gemini 3.1 Pro Preview，盛赞：

“Gemini不仅是一款优秀模型，更出色的模型正以不可阻挡之势而来。”

值得注意的是，约一周前谷歌推出了针对科学、研究、工程等复杂开放式问题的“专用推理模式”Gemini 3 Deep Think，这是姚顺宇从Anthropic跳槽至谷歌DeepMind后参与的首个项目。如今的Gemini 3.1 Pro Preview与Gemini 3 Deep Think联系紧密，官方称其“直接基于Gemini 3 Deep Think的经验和技术构建”，相当于将Deep Think的核心推理提升技术“下放”到更广泛可用的Pro模型中。

01 Gemini 3.1 Pro Preview的核心能力

既然新模型的优势在于处理“超级复杂”任务，谷歌官方博文重点展示了以下几类应用场景：

其一，通过简单提示词生成高质量SVG动画。

前代模型虽也具备此功能，但3.1 Pro的进步十分显著。例如提示“生成SVG动画，展现变色龙静坐在树枝上，眼睛随鼠标光标移动”，Gemini 3 Pro生成的动画背景单一、变色龙形象呆板，甚至出现一侧两只眼睛的错误；而3.1 Pro的作品拥有深绿色丛林背景，变色龙带有黄色斑纹与圆点装饰，眼睛立体、腿部姿势自然。

再如提示“生成滑动切换开关SVG，鼠标悬停太阳图标时变为发光月亮，背景从明亮平滑渐变至黑暗，采用简洁扁平UI风格”，Gemini 3 Pro的图标仅为缺角圆形，以黄白区分昼夜；3.1 Pro则呈现黄日白云与月牙繁星的丝滑切换，效果更精致。

简言之，Gemini 3 Pro的动画效果曾被调侃为“学了三年动画”的水平，而3.1 Pro的SVG动画已达到可直接使用的程度。

其二，构建工程级系统。

Gemini 3.1 Pro能依据复杂自然语言指令，生成融合3D渲染、实时太阳星历计算、API异步拉取与物理光效的完整交互系统，而非简单演示页面。例如用户指令生成高保真可交互3D国际空间站轨道追踪器，模型输出了采用高分辨率Blue Marble纹理贴图的精细3D地球模型。

其三，生成交互式创意系统。

谷歌展示了3.1 Pro编写的复杂3D椋鸟群舞模拟，不仅生成视觉代码，还构建了沉浸式体验——用户可通过手部追踪操控鸟群，同时聆听随鸟群运动变化的生成式配乐，为研究人员与设计师提供了原型化感官丰富界面的有力工具。

其四，将文学主题转化为可运行代码。

这是普通人最易感知其强大的能力。当要求为艾米莉·勃朗特《呼啸山庄》打造现代个人作品集网站时，模型并非简单总结文本，而是基于小说氛围与情绪推理，设计出简洁且具当代感的界面，捕捉主人公精神内核。这种抽象推理能力的价值不言而喻。

02 性能究竟有多强？

新模型的性能提升在测试数据中得到充分体现。谷歌官方显示，Gemini 3.1 Pro在ARC-AGI-2基准测试（评估模型解决全新逻辑模式的能力）中验证得分达77.1%，推理性能较3 Pro提升超一倍。

此外，在GPQA Diamond（科学知识测试）中得分94.3%，智能体类基准MCP Atlas得分69.2%，真实网络浏览与信息整合能力基准BrowseComp得分85.9%，均超过Anthropic的Sonnet 4.6、Opus 4.6及OpenAI的GPT-5.2与GPT-5.3-Codex。其在ARC抽象推理和BrowseComp搜索任务上的优势，显示出明显的智能体倾向，而非单纯知识模型。

第三方评测机构也指出，Gemini 3.1 Pro在Artificial Analysis Intelligence Index的10项评测中领先6项，较3 Pro在推理与知识、代码能力及降低幻觉方面进步显著。

同时，3.1 Pro Preview保持较高token效率：运行完整Artificial Analysis Intelligence Index约需5700万token（仅比3 Pro多100万），低于Opus 4.6（max）和GPT-5.2（xhigh）等前沿模型。结合更低的单token定价，其成本优势明显——运行完整Intelligence Index的成本不到Opus 4.6（max）的一半，虽约为开源模型GLM-5的两倍，但综合性能仍具竞争力。

03 能力翻倍，价格不变

谷歌官方API定价显示，Gemini 3 Pro与3.1 Pro Preview收费结构一致：小于200k tokens时，每百万token输入约2美元、输出4美元；大于200k tokens时，输入4美元、输出18美元。上下文缓存方面，按提示词规模每百万token收0.20至0.40美元，另加每小时每百万token4.50美元存储费。

这一定价与上一代3 Pro持平，较Anthropic Opus系列（输入/输出单价约5美元/25美元）更具优势。结合其突出的模型能力，性价比十分可观。目前该版本为“预览版”，正式版即将推出，“.1”的迭代也暗示这只是谷歌的“小试牛刀”。

当前，开发者可在AI Studio、Gemini API、Gemini CLI、Google Antigravity及Android Studio使用3.1 Pro；企业用户可通过Vertex AI和Gemini Enterprise使用；普通用户在Gemini应用和NotebookLM（仅限Pro和Ultra订阅用户）也能体验。

社区中已有不少开发者上手实践，产出诸多惊艳成果：有人用3.1 Pro生成可交互3D机械级汽车悬架系统模拟器，整合机械工程建模、物理逻辑与3D可视化；有人制作“捉鬼猎人走过闹鬼房子”的循环动画，感叹“Gemini所言非虚”。

谷歌此次迭代虽版本号变化微小，却大幅提升了推理与代码能力，且定价稳定。社区的实践热情也印证了其能力与实用性。AI行业竞争已进入“性价比”新阶段，企业与开发者更关注token的投入产出比。谷歌这一步不仅巩固了自身地位，也将竞争推向更注重效率的方向。接下来，Anthropic、OpenAI等竞争对手将如何应对，值得期待。

本文来自微信公众号“字母AI”，作者：小金牙，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

一步之遥未登台，短道新星杨婧茹渴望更快滑行

伤病频发，顶级滑雪运动员为何感觉赛事风险加剧？

春节机器人租赁成新“年味担当”，热潮过后能否持续？

春节体验“白人式度假”的中国人：原来躺平才是真享受？

2025光伏行业变局：部分企业黯然退场，国资精准“托底”优质资产

项目推荐

迪瓜租机

康老板 · 氧疗堂