字节受到张一鸣的鼓励 AI 将军们,制作国内最有价值的视频大模型

03-26 11:08

“创业要做不一致但正确的事情。”张一鸣的话曾经影响了无数的字节企业家,包括前字节AI将领王长虎。


2017年,王长虎作为字节跳动视频生态兴起的关键人物之一,加入了当时也被称为“今日头条”的字节跳动,担任AI。 在抖音和TikTok两大现象级产品中,Lab总监完全参与了从0到1的建设。


2023年,当视频生成跑道还处于“非共识”阶段时,王长虎避开了当时如火如荼的大型文学生文学跑道,下注了大型视觉模型,先做了国外市场。


“当时支持我们的信念是,我们坚信我们所做的是非共识但正确的。”这也是王长虎在字节期间经常听到张一鸣强调的观点。


在移动互联网时代,王长虎见证了抖音的颠覆,坚信视频生成跑道上有平台级产品的机会。“UGC 到 AIGC,变化是U和AI,最重要的视觉问题不一样,但系统处理视觉问题所需的核心技术能力是一脉相承的。“王长虎想做的是一个普通人可以轻松玩AI视频创作的国家应用。


直到Sora在2024年初出现,人们对视频生成的热情才被点燃,王长虎也走到了聚光灯下。


Sora 发布后,社交媒体上流传着一张梗图:Sora 这是一座巨大的佛像坐在宝座上,下面跪着一群小崇拜者,包括一群小崇拜者, Runway、Pika、SVD、PixVerse 等待十多个视频生成模型和产品。


PixVerse由王长虎开发, 是 “崇拜者” 中国公司开发的唯一产品。


看到这张照片后,王长虎的心情非常复杂。他和Runway一起跪在第一排。、Pika、王长虎很荣幸当时SVD等最好的视频生成产品放在一起,但更多的是缺点。“如果我们在过去的一年里有更多的投资和计算资源,有可能不是美国人第一个做Sora,而是我们。”


近日,王长虎创立的爱诗科技刚刚完成A5轮融资,累计融资金额超过4亿元,成为中国视频模型领域融资规模最大的创业公司。


然而,随着老东家字节逐渐进入视频生成跑道,当爱诗科技的非共识成为大厂的新共识时,王长虎的新挑战也随之进行。


01


Sora诞生的第二天,王长虎一大早就被微信吵醒了。投资者、朋友、家人和同事问他:“你觉得Sora怎么样?”有人问他,超越和追逐Sora的最佳窗口期是多久?


一年前的2023年,王长虎的回答是“视频生成行业非常寒冷的一年”。又是在那一年,在几乎所有人都不看好视频生成赛道的前提下,王长虎创立了爱诗科技。


甚至,在获得天使投资之前,王长虎也收到了投资者朱啸虎的劝阻:“你最好回去工作,中国没有大模型的机会”。


然而,作为一名技术理想主义者,王长虎经历了两次技术浪潮:深度学习和计算机视觉。他认为生成式AI是“十年一遇的机会”,不愿意错过时代的变化。


20年前,王长虎的第一项研究与AIGC有关。2004年,王长虎是中国科学技术大学电子工程与信息科学系的大四学生。他做了人生第一个研究,就是根据一张或多张脸的图片生成脸的3D模型。


同年,王长虎进入微软亚洲研究所实习,毕业于中国科学技术大学后成为正式员工。在此期间,王长虎的很多任务都与AIGC有关,但13年后,他离开微软去了字节跳动。


“微软可以做世界顶尖的科研,但科研项目应用于公司产品需要很长时间。”在王长虎的记忆中,他2000年做的事情,几年后才真正应用到必要的搜索引擎中,新技术很难在第一时间影响用户。


与其他大厂商不同,AI部门是在商品成熟后建立的。在开发短视频产品的同时,字节跳动建立了AI。 Lab部门。正因为如此,2017年加入字节跳动后,王长虎从0到1完全参与了抖音、TikTok等短视频产品的建设和发展,并为集团的所有产品提供了AI技术保障和业务解决方案。


但是,当TikTok、TikTok等关键应用获得具有较大优势的市场地位,并开始进入“流量如何商业化”时期,AI 字节位置的Lab松动了。这个问题来自于AI 从张一鸣到当时的抖音负责人张楠,Lab负责人马维英的报告对象可以窥见端倪,这意味着AI Lab不再是一个集团级的前瞻性项目,而是一个服务于抖音这个应用的技术团队。


2021年,王长虎离开字节跳动。之所以离开,用王长虎自己的话来说,是因为“我发现自己进入了舒适区,想挑战新事物。”



王长虎一直有创业的感觉。字节离开后,他并没有想过直接创业,但当时生成型AI技术的发展并不足以对整个行业产生巨大的影响。


直到Stable Diffusion、随着ChatGPT的出现,王长虎的想法已经到了一个新的AI时代。


在移动互联网时代见证了抖音的颠覆,王长虎坚信,视频生成跑道上有平台级产品的机会。


2023年 4 月,王长虎找到了现在的合作伙伴谢旭璋,他曾经是光源资本TMT/AI的负责人,并获得了超过5000万的天使轮融资,然后宣布成立了一家新公司“爱诗科技”。


同年6 月份,几个核心人员到位,大部分核心成员都跟随王长虎在字节跳动中打了一场硬仗。在团队成立的第一天,王长虎将目标客户群定位为每天玩TikTok和TikTok的用户。“我们的基因是随着TikTok和TikTok而成长起来的,肯定主要是tok。 C 。”


02


直到2024 年初,一个名字叫做 PixVerse 的 AI 视频生成产品在国外突然流行起来,第一个月浏览量突破120万,超过了同期硅谷明星创业产品Pika上线三个月后的200万个月浏览量。


这个答案是王长虎创业半年交出的,但是另一方面,一个视频生成领域的巨大变化正在酝酿。


一个月后,Sora震惊地发布了。虽然是浏览版,但凭借60秒一镜的高清生成能力和3D空间的动态连接,科技圈迅速爆发。许多业内人士将Sora视为AI视频行业的ChatGPT时刻。


由于Sora的到来,AI视频生成的战场开始真正热起来。



王长虎也因此而备受关注。"Sora的出现恰恰证明了我们最初制定的技术路线是正确的."在王长虎看来,Sora的技术发展相当于在GPT-2和GPT-3之间,还没有达到GPT-4的水平,给市场留下了很大的空间。"我们有信心在3-6个月内赶上Sora的现状."


不只是王长虎,面对Sora,当时的时尚是“期货”,海外Runway、Luma AI等一批创业公司推出了最新的视频生成模式,阿里、腾讯等国内巨头也发布了基于自身优势的视频生成模式。很多大型公司都把“国产Sora”的研发放在了优先的战略层面。


字节跳动也杀死了王长虎的老东家。 事实上,在Sora发布之前,抖音前CEO张楠刚刚转岗剪影,正准备在AI视频生成领域大于一番。Sora的出现加速了字节AI生成视频产品的研发速度,当月,剪影推出了一款名为Dreamina的AI绘画工具。三个月后,剪影Dreamina正式更名为“即梦”,AI绘图和AI视频生成功能上线,生成时间为3-12秒。


王长虎站在海外,第一次与老东家的对抗发生在国际市场。PixVerse发布半年后,字节旗下 AI 视频生成商品 Dreamina(国内版本名为“即梦”) CapCut 主界面(国际版“剪影”)。


现在,老东家亲自下场,不仅在资源上对王长虎造成了辗压,而且在用户接触上构建了一个不可逾越的生态堡垒。


剪影国际版CapCut于2020年推出。CapCut也与TikTok席卷全球,与之深度绑定的CapCut也搭上了顺风车。根据移动数据监控公司SensorTower的数据,CapCutMAU已经超过4亿,占据了全球移动视频编辑市场的80%以上。


在庞大的用户基础上,从UGC到AIGC的字节跳动似乎更加顺理成章。CapCut 能够轻松地把新的放在一边 AIGC 功能通过 TikTok 各种推广方式到达用户,然后通过TikTok推出特效全球竞争。这种“AI工具-内容裂变-流量反馈”的飞轮效应,是创业公司难以复制的生态优势。


“Tiktok也是在巨人围攻的过程中成长起来的。”在王长虎看来,小公司有小公司的优势,比如决策流程快,可以专注于做一件事。“在视频生成的这个方向上,一方面我们有先发优势,另一方面我们有信心继续走在前面。”


然而,现实远比理想残酷。截至目前,国内AI视频生成跑道已挤入近20家创业公司,但巨头的生态绞杀从未停止,部分基础通过CapCut免费开放字节跳动。 AI 功能,u200c阿里云视频生成大模型万相2.1已开源...创业者不仅要证明自己比巨人更快,更要在用户心智被占领之前,找出巨人“不愿意弯腰捡硬币”的垂直间隙。


03


世界上有Sora需要追逐,之后有巨人来势汹汹。同时,王长虎也加速了产品迭代。


从 2024 年初上线至今,PixVerse 更新了模型版本 6 其次,凭借“毒液”、“机器人变身”等特效,在社交媒体上频频流行起来。截至目前,PixVerse全球用户已超过4000万,每月活跃用户(MAU)达1500万。


然而,百度董事长兼首席执行官李彦宏率先在视频生成跑道上泼了一盆冷水。2024年第三季度总监会上,李彦宏明确表示:“Sora的视频生成投资周期太长,10年或20年都未必能获得商业收入,所以不管它有多受欢迎,百度都不会这么做。


Sora的成本究竟有多高?Factorialial市场研究机构 Funds给出了一份报告,Sora模型至少需要使用4200~10500英伟达H100元,如果想要大规模应用,还需要增加大约72万张英伟达H100元,仅从GPU投资成本来看,就需要超过200亿美元。


面对巨人的压力和有限的资源,王长虎也在不断降低训练成本。字节期间主导的视频AI中台的经验,让团队掌握了从海量数据中选择少量高质量数据来训练更好的模型能力,“训练成本只有大厂商的十分之一甚至更低”。


经过一年的蓄气,去年12月,Sora官方版终于来不及了,但效果并不理想。很多用户吐槽“不如中国开源模式”,价格也是满满的槽点,Pro版一个月要花200块钱。


随着Sora的热度降低,资本对AI视频生成领域的投资越来越谨慎。在AI这个快速迭代的行业,市场瞬息万变,资金流动也发生了变化。年初,DeepSeek掀起了一场算率革命,加速了推理模型的研发。最近,Manus的流行点燃了Agent生态。


同时,随着行业竞争的加剧,AI视频生成工具之间的多样性越来越小,客户增长乏力已经成为不争的事实。


王长虎的 PixVerse 还没有逃脱浏览量下降的趋势。依据 aig crank 数据,2025 年 2 月,PixVerse 页面浏览量下降,环比下降。 14%。根据SimilarWeb的统计,LumamarWeb是世界领先的AI视频生成公司 AI、每月Pika的浏览量均呈环比下降趋势。



当行业陷入同质化竞争时,王长虎也准备把战场变成中国,以开拓更多的潜在客户。据悉,国产版PixVerse已经进入准备阶段,预计近期将在网页和APP产品上线。


“视频生成技术非常接近流量和商业化,国内市场的用户基数和应用领域有更多的发展和实践可能性。” 王长虎付费订阅的商业化在客户付费意愿较高的国际市场得到了验证。


然而,在中国,免费和开源的视频生成工具已经在市场上占据了一定的市场份额。老东家字节跳动的剪影已经集成了AI视频生成功能;通过云服务生态,腾讯智影和百度AI创作平台不断蚕食企业级市场;在开源社区,阿里ModelScopel、国产模型如清华VideoGPT不断迭代,技术壁垒正在消除。


更严重的是,国内用户只有北美市场的三分之一愿意支付AI工具,超过60%的创作者更喜欢免费的基本功能——这与PixVerse赖以在国外生存的订阅商业模式形成矛盾。


当技术环城河遭受生态压力时,进入中国的王长虎需要证明的是,在算率和流量的多重绞杀下,如何继续讲小而美的故事。


本文来自微信微信官方账号“直接面对AI”,作者:王木木,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com