中美AI赛道各有千秋:视频模型成中国破局关键

3天前
曾有一张对比中美AI发展方向的图片引发热议:当美国OpenAI和Anthropic专注于大模型迭代时,中国的元宝和千问却在进行红包大战,这种反差一度被视为讽刺。



但这个笑话很快失去了时效性。字节跳动和快手相继发布新一代视频模型,在外网引发刷屏效应,让海外再次惊叹中国AI的强大实力。这恰如钱钟书在《围城》中所写:世界就像一座围城,城内的人向往城外,城外的人羡慕城内。


字节的Seedance 2.0革新了视频生成技术,凭借字节的高关注度迅速获得好评;快手的Kling 3.0同样实力强劲,二者并非刻意营造的“双星闪耀”,而是真实反映了中国视频AI的水平。两个模型路线不同:Seedance 2.0侧重运镜、转场等短视频创作功能,利好普通创作者;Kling 3.0则偏向影视化、真实化效果,面向专业团队。但长期来看,它们终将殊途同归,大幅替代现有视频生产管线。


多模态是AI贴近大众的重要途径。去年ChatGPT和Gemini的增长,都得益于多模态技术的突破。今年,视频模型成为新战场:马斯克发布了Grok的视频模型Imagine 1.0,谷歌推出Genie 3,中美巨头纷纷布局。视频模型曾因技术瓶颈发展缓慢,但2026年已接近突破临界点。回想威尔·史密斯“吃意大利面”的AI视频,不过是两三年前的事,技术进化速度令人惊叹。


中美AI的差异,本质上源于商业环境不同。美国AI巨头发力AI Coding,因其易货币化,且Coding自由的终点是工具、软件零成本化,导致美股SaaS赛道崩塌——这个积累30年的万亿市场,成为AI价值的最佳证明。中国AI公司虽羡慕美国的Claude Opus 4.6和GPT-5.3-Codex,但无法在不存在的市场中替代产值,因此转向更贴合国内生态的多模态领域。


王慧文曾精辟指出:“我们曾经以为,中国SaaS会像美国SaaS那么值钱,现在看,美国SaaS会像中国SaaS这么不值钱。”这句话点破了中美AI发展路径差异的核心。



字节跳动对AI寄予厚望,内部启动赛马机制,至少有三方势力竞争“下一个抖音”:一是张楠负责的即梦,她曾成功打造抖音,代表字节从0到1的战斗力;二是朱骏带领的豆包团队,朱骏作为Musical.ly创始人,再次证明了自己的能力;三是抖音部门本身,推出“AI抖音”App,意图抢占赛道。字节的活力和野心,在大厂中实属罕见。




中国AI公司本月还有重量级发布,让我们拭目以待这场“神仙打架”的盛宴。


本文来自微信公众号 “阑夕”(ID:techread),作者:→ →,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com