核心团队流失后逆袭!Grok Imagine夺三冠,马斯克高调官宣

26分钟前
xAI在华人联创近乎全部离开的情况下,意外传来捷报!


Grok Imagine一举斩获三项金牌!马斯克在社交平台上兴奋地分享了这一消息。




在DesignArena视频排行榜中,xAI的Grok Imagine表现强势,包揽视频竞技场(Elo分数1337)、图像转视频(Elo分数1298)和视频编辑(Elo分数1291)三个项目的冠军,成绩远超谷歌Veo 3.1、Sora等竞争对手。


xAI终于推出了一款AI黑马产品!


为何称它为黑马?


因为就在几个月前,Grok Imagine还只是个刚推出的「新生儿」,如今却登上了全球AI视频排行榜的顶端。


马斯克,这位一心想把人类送上火星的企业家。


他的xAI有着长远目标——「探索宇宙,加速人类科学发现」。



Grok这个名字,灵感来源于科幻经典《银河系漫游指南》,书中有一本万能指南书,能解答宇宙的所有问题。


马斯克的野心是让AI像那本指南一样,不仅能处理数据,还能真正「理解」世界。


Grok Imagine正是这一愿景的一部分。


自2025年8月推出以来,它迭代迅速,从最初的简单图像生成,发展到如今能处理复杂的视频任务,进步速度如同火箭发射般迅猛。


马斯克本人在推特上激动地发文:「Grok Imagine三金加冕!」


这并非自夸,数据足以证明。



排行榜「三连冠」


Grok Imagine为何如此出色?


先来说说这个「竞技场」。


AI视频领域有个名为DesignArena的平台,它就像全球AI模型的「擂台赛」。



这里不依赖实验室数据比拼,而是让真人用户投票:将两个AI生成的视频放在用户面前,由用户选择哪个更好。


这种方式采用的是Elo评分系统——你可能在棋坛听说过,它和下棋类似,赢的次数多分数就高。


Grok Imagine在这里一鸣惊人,拿下三个类别的第一:


视频生成竞技场:Elo分数1337,比第二名高出33分。简单来说,它能根据文字描述直接生成视频,比如输入「一只猫在月球上跳舞」,就能生成流畅的短片,还带有音效。


图像转视频:Elo分数1298,击败了谷歌的Veo 3.1、中国的Kling和OpenAI的Sora。这项功能是让静态图片「动」起来,比如把一张风景照变成风吹树摇的动态场景。


视频编辑:Elo分数1291,能轻松替换视频里的物体、改变风格、添加动画,甚至延长片段。最厉害的是,它完成一个任务平均只需1分5秒,比对手快很多。





它为何如此强大?


不是因为模型参数更多(「肌肉」更大),而是设计巧妙。


传统AI视频工具像大力士,靠堆积海量数据和计算力取胜。但Grok Imagine像个巧匠,注重「高效泛化」——用更少的资源,学得更快、做得更好。


它构建了新的「Pareto前沿」,通俗地说,就是在质量、速度和成本之间找到了最佳平衡点。生成一分钟带音频的视频,只需4.20美元,比Veo的12美元或Sora的30美元便宜不少。


这就好比开车:别人开耗油的车,你开电动车,还跑得更快。


背后的故事更有意思。


xAI团队从2023年的Grok-1模型开始,短短几个月就把原型从无到有,发展到能与顶级模型抗衡。他们不是闭门造车,而是不断优化用户体验。


进步速度之快,在行业中独树一帜。



现在,Grok Imagine每天生成的视频量,已经超过所有竞争对手的总和!


团队成员如Haotian Liu这样的专家,专注于多模态AI(即让AI理解文字、图像、视频的混合信息),他们的「执念」是让AI不只是模仿,而是真正理解场景逻辑。



xAI的Omni团队负责人:Haotian Liu


行业震动


从「蛮力时代」到「智慧革命」


AI视频领域原本是巨头们的战场。


OpenAI的Sora像艺术大师,能生成高品质长视频;谷歌Veo注重音频同步;Kling则在亚洲市场发力。


但Grok Imagine的出现,就像往池塘里扔了一颗石子,激起层层涟漪。它证明了:AI的进步不一定靠烧钱堆规模,小团队也能实现逆袭。



在Artificial Analysis的基准测试中,它也占据了文本转视频和图像转视频的第一。这颠覆了以往的认知——以前大家认为「模型越大越好」,现在焦点转向了「结构更精妙」。


「Aha时刻」就在这里:Grok Imagine不是在追赶,而是在重塑规则。


它从2025年7月只能生成6秒短片起步,到2026年1月推出API接口,支持开发者集成。


短短半年,就从「无名小卒」变成了「三冠王」。


这样的速度,让人联想到马斯克的SpaceX:别人还在测试火箭,他已经实现了火箭回收着陆。


行业反应热烈,有人称「Grok Imagine是AI视频的新标准」,推特上满是惊叹之声。


那么,这对普通人来说意味着什么?

别觉得这是高大上的科技游戏,它离你很近。


试想一下:你是个小博主,想做个产品演示视频?


以前得请编辑,花好几天时间。现在用Grok Imagine,几分钟就能搞定,还带有专业音效。


对企业而言,营销视频、培训动画都能实现全自动化,成本大幅降低。甚至在汽车领域,xAI和特斯拉联动,能让车载AI分析仪表盘视频,或为Optimus机器人生成训练片段。


更广泛地说,这加速了AGI(通用人工智能)的到来。


AI不再是冷冰冰的工具,而是你的创意伙伴。


它能理解你的意图,生成个性化内容,推动从「蛮力计算」向「智能理解」的转变。未来,视频创作会像发短信一样简单,每个人都能成为导演。


当然,挑战依然存在。


Grok Imagine目前只能生成15秒的片段,复杂场景有时还需要优化。但它的崛起提醒我们:创新不靠垄断,而是靠智慧与坚持。马斯克的xAI,正用实际行动证明,AI的未来是开放且高效的。


下一个黑马,会是你手中的工具吗?读到这里,你是不是也想尝试生成一段属于自己的「科幻短片」?


这就是Grok Imagine带来的启发——科技不是遥远的星星,而是点亮日常生活的火炬。


参考资料:


https://x.com/elonmusk/status/2033442939796681132


https://arena.ai/leaderboard/image-to-video


本文来自微信公众号“新智元”,作者:新智元,编辑:KingHZ,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com