字节终于掀起了桌子

2024-05-23

低调潜行一年多的字节跳动，终于憋住了一个大招。

5 月 15 日本，字节跳动首次向大众“推销”。 AI 大模型——其自研豆包“全家桶”官方宣布将采用火山引擎(字节六大业务领域之一)，其他五个领域分别是视频、大理教育、飞书、朝夕。TikTok）提供外部服务。

到目前为止，字节跳动纵身跳入国内大模型混战，其大模型版图正式暴露。

图表：豆包大模型“全家桶”

由于字节已经越过了模型效果、推理成本、落地难度这三个最关键的门槛，所以出手就是“王炸”。

第一，AI模型效果落地是最关键的，好的模型只有大量的使用才能打磨出来——根据火山引擎的官方数据，经过一年的迭代，大豆包模型正在成为中国使用量最大、应用领域最丰富的模型之一，日均处理 1200 亿 Tokens 文本，生成 3000 万张照片。

另外，字节跳动产品和战略副总裁朱骏透露，豆包平台每月活跃用户达2600万，已经超过2600万。 800 建立了一万个智能体。作为对比，QuestMobile 资料显示，到今年为止 3 月亮，豆包(字节跳动)、文心一言(百度)、天工(昆仑万维)、讯飞星火(科大讯飞)、Kimi 智能化助手(月暗面)位于 AIGC APP月活 TOP5——令人恐惧的是，豆包上线仅三个月就完成了用户反击。

信息来源：QuestMobile 统计

在这背后，虎嗅了解到，在过去的一年里，字节跳动通过拆解明确了各部门。 OKR(例如抖音主要负责拉新，字节主要负责拉新， AI 产品的 Flow 部门负责开发和产品增长)完成了部门之间的互不干扰，解决了互联网企业快速扩张面临的组织协作问题，这是中国的梦想。 AI 在互联网企业中，最明确的战略之一。

值得注意的是，豆包大模型(本名：云雀)先于 2023 2008年在字节内完成上线，并基于豆包大模型打造。 “豆包”AI对话助手、AI 应用开发平台“纽扣”、“猫箱”、星绘、即梦等互动娱乐应用 AI 创作工具，并将大模型连接到字节跳动的旗下，如抖音、番茄小说、飞书、剪影等。 50 多个业务，用来提高效率，优化产品体验。

“技术正在快速进化，但用户的核心需求没有改变，如高效获取信息、提高工作效率、自我表达、社交娱乐等。字节做了很多探索，找到了适合大模型应用的形式，希望自然交互能进入更多人的日常生活。”朱骏说。

那不是盲目的乐观，IDC 发布的《2024 AIGC 应用层十大趋势白皮书预测，2024 全球每年都会出现超越 5 亿次新应用，相当于过去 40 当年出现的应用数量总和，智能应用将呈现爆发式增长，大模型浪潮将加速渗透到人们的日常生活中。

第二，降低推理成本是大模型快速进入“价值创造阶段”的关键因素。

例如，腾讯混合元模型选择混合专家模型 (MoE）构造，自研 Angel 机器学习平台，训练速度达到主流框架 2.6 与行业主流框架相比，推理成本降低。 70%；OpenAI、最近智谱大模型也都降低了大模型的价格。

然而，当火山发动机总裁谭待宣布主要的豆包模型(小于等于等于推理输入价格仅为32K) 0.0008 元/千 Tokens 当时，人们还是会感到惊讶——要知道，市场上同规格模型的定价一般都是 0.12 元/千 Tokens，而且豆包的主要模型比行业便宜 99.3%。

按照这个价格，8 可以买到一元钱的豆包模型 1000万 Tokens，大概 1600 万只汉字——它正以“价格屠夫”的姿态突破大型市场，被外界戏称为“拉响大模型市场价格战第一枪”。

对于这一点，谭待表示，背后有两个原因：“一是可以做到，二是需要这样做；主力模型比行业便宜 99.3% 可以在技术上实现，未来还有很多方法可以降低成本。

最后，豆包分布式推理也有混合调度，充分发挥各种异构率，解决了推理计算能力的问题，从而将模型推理的成本降低到非常低的水平。

“以前公司担心创新。 ROI 打错了，一是创新项目。 90% 会失败，其次，创新会根据消耗来创新。 100 亿 Tokens 算就要80 万；现在的费用只需要 8000元，失败也花不了多少钱，但是还剩下。 10%的项目成功后可以赚回所有的投资，这无疑可以帮助更多的公司轻装上阵，无负担投身。 AI 谭待说：“浪潮。

当然，字节愿意为企业“搭建平台”的深层次原因是，移动互联网行业已经到了客户和流量达到顶峰的成熟阶段，监管将更加注重产业互联网的推广和建设，这意味着技术将来到平台重构生态的关键时期。

就像美团创始人兼一样 CEO 当初王兴讨论过 BAT 在竞争关系中，如果把竞争这个词放在一起，就会变成惯性思维。“麦克阿瑟将军在西点军校告别演讲。”Only the dead have seen the end of war"(只有死去的人才能看到战争的结束)，战斗只是从一个战场变成另一个战场，由一次机会转变为另一次机会，总是在不断变化。”

尤其，ChatGPT 出现让整个互联网躁动不安，追逐大模型的浪潮让互联网陷入混战的焦虑状态，而心中有老虎的企业正在寻找向上攀登的入口——当通用人工智能时代呼啸而来，字节手握网络层和数据层的独特优势，Tiktok拥有丰富的数据素材和充足的算率资源。在快速发展时期，必须果断投入(包括技术生态迭代、R&D投资等)，才能赢得未来的机票。

下面是虎嗅和火山发动机总裁谭待两次(5次) 月 15 日、5 月 16 日)交流记录(部分表述因为阅读方便需要删除)：

为什么字节要降低价格？

Q：业内有声音说大模型算率资源匮乏，为什么字节愿意大幅度降价？

谭待：一般来说，计算率资源不够就是训练，但是今天提到的大模型。 ToB 服务主要是推理。只要技术基础做得好，就可以用各种异构算率来满足性能，减少延迟，解决算率瓶颈。豆包分布式推理也有混合调度，就是通过调度各种异构算率来解决推理算力的问题。

第二，处理算率也解决了成本问题，可以将模型推理成本降低到很低的水平。以前公司担心创新 ROI 打错了，一是创新项目。 90% 会失败，二是创新试错贵(根据消耗 100 亿Tokens 算就要80 万）；现在试错成本降低了 8000元，失败成本可以控制，只要剩下。 10%的项目可以实现，可以赚回所有的投资，也可以让很多公司轻装上阵，无负担投身。 AI 浪潮。

Q：在这个阶段，字节将价格卷入了以厘为单位的低价，这对整个市场有好处吗？

谭待：自然，很多企业可以以较低的成本进行各种创新，对于做大型企业家来说，没有一个是靠做大型企业的。 ToB 赚大钱，通过 ToB 服务不能循环自己的大模型。现在还是一个特别早期的阶段。最重要的是把蛋糕做大，先做普惠。

Q：字节能压低了同行的价格豆包99.3%的性能和成本如何？

谭待：现在模型应用落地时，精调是关键，豆包 pro 支持 128k 可以调整。豆包的主要模型可以和所有的主要模型进行比较。网上可以看到很多第三方测试，拿豆包。就APP而言，今天的月活 2600 万，用户越多调用量越大，模型自然就越好。

关于费用问题，ToB 业务取决于长期。用亏损换取利润是不可持续的。字节从来不走这样的路。降价源于技术自信。这个定价就是火山对技术有信心，未来还有很多方法可以继续降低成本。

Q：大型豆包完全打下了价格，为什么说“低价”是对技术的信心？

谭待：首先，技术上有很多方法可以降低成本，使效果明显，比如优化和改进模型结构；其次，在项目之前，是单机推理，现在是分布式推理，自然可以更好的利用各种底层算率，从而大大降低成本。特别是调度量很大之后，不同的负荷可以作为混合调度，大大降低了成本。并且，OpenAI 同时也在降价，想象未来大模型在人们的日常生活中每天都在使用，低价是真正广泛使用的前提。

其次，今年大模型能力明显提升，应用越来越重要。很多客户都想尝试做大模型，但由于价格(AI试错和业务创新风险高)，他们不得不面对很多不确定性，试错成本必须降低得很低，这将被大家(公司和个人开发者)广泛使用。所以，目前最迫切的就是降低成本。

Q：在字节内使用豆包大模型的产品怎么样？

谭待：首先，同名 APP 到今年为止，豆包 4 月份，豆包在苹果中国。 App Store 效率排名第一；其安卓市场累计下载量 1.37 亿，在 AIGC 类应用中断崖式领先用户数量(月活达到 2600 万)表示效果很好，还有星画这样的创新应用。

除了 AI 除了原生应用，Tiktok、头条、飞书的一些功能都使用了大模型。比如Tiktok搜索和头条搜索结果都是用大豆包模型生成的，可以进一步询问客户想知道什么信息。许多营销文案、导购、助手等领域都应用于Tiktok电子商务。

除这些应用领域外，传统的许多应用领域 NLP(自然语言理解)解决的问题豆包也能做得更好，可以大大提高一些业务后台操作的效率。

Q：人工智能落地场景非常重要，火山有哪些客户应用领域可以共享？

谭待：移动电话的互动场景太多了，手机搜索，助手AI 等（OPPO 小布助理，荣誉智能办公助理，小米“小爱同学”、华硕豆叮 AI 所有助手都接入了火山发动机的大模型服务)；现在有很多汽车。导航顺便看看商业区、餐厅和周边电影院。(玩手机不方便的时候)模型会告诉手找出相应的内容，完成互动；比如汽车驾驶舱对模型能力要求不高，适用于通用的豆包模型 lite，不但推理价格较低，延迟也较低 50%。

当然，一方面要提高场景落地的技术，比如 pro、lite、角色扮演和语音都有广泛的使用场景；另一方面，应用生态是一群人的群体智慧。只有模型更好，成本更低，更容易落地，生态才能繁荣。大企业代码高，但个人开发者想要的是低代码，只有门槛低才能做到，形成。 AI 时代创新。

字节蓄气，“火山”爆发？

Q：如何看待网络大佬在模型赛道上的残酷竞争？

谭待：国内的大模型还没有谈竞争，因为大模型还处于起步阶段，池塘有多大，鱼有多大，大模型市场才刚刚开始。这个时候，重点是做好大模型，做好应用，降低成本，让更多的人和企业受益。现在竞争还没有激烈。

Q：在此之前，周鸿祎和李彦宏就开源和闭源进行了讨论，火山会朝开源还是闭源发展？

谭待：首先，对于模型公司来说，开源闭源不是非黑即白，而是一种综合的方式。我们也在讨论未来某个版本或尺寸模型是否会使用开源。其次，公司模型的应用是开源还是闭源，本质在于背后的需求，是担心安全、成本还是服务。

Q：因特网大厂商在云计算领域竞争激烈，大模型在云计算领域的应用将重点放在哪些方面？

谭待：云生态包含 IaaS、PaaS、SaaS，AI 大模型本身就是云的锦上添花，就是把数字化做得更深更广。比如模型推理可以通过云的方式降低成本，所以从价格上考虑。 AI 就是建立一种算率与智能的相关性，将越来越多的数字化需求、生活场景与算率相结合。

火山当然更加重视火山 ToB方向:一是有些行业非常集中，比如手机、汽车可以通过联盟一起做好；第二，有些行业不是特别清晰，所以和最有想法的公司深度合作；第三，开发者非常重要。在新技术浪潮面前做出不同创新的不是过去的巨头，而是新的开发者，怎样服务好他们，让他们做得更好？ AI 应用非常重要。

而且，作为一个公共云，字节的概念是要低成本。就像电商要高质量低价一样，降低成本是提到火山引擎的愿景。不知道别人有没有写，这是认知上的区别。

Q：字节具有数据优势，在文生视频这方面是否有布局实现弯道超车？

谭待：有一种字节产品即梦（Dreamina），除了文生图，还有一些短视频生成功能。模型训练一定要技术扎实，本质上不会有弯道超越；其他模式也是如此。首先，我们应该做好基础工作。如果基础做不好，文生图就是‘人工智障’——因为连文字都看不懂，视频能好到哪里去？所以没有弯道超越，要循序渐进。

虎嗅注：事实上，2023年字节跳动年 11 已经发布了视频生成研究成果。 PixelDance，在文本指导的基础上提出头尾帧照片指导的技术方法，可以生成高度一致、动态丰富的视频；今年 1 月亮，字节再次发布视频生成模型 MagicVideo-V2，效果比肩 SVD-XT、Pika1.0、Gen-2（Runway）类似的模型。

Q：近期 OpenAI（GPT-4o）、谷歌(谷歌I/O大会升级) Gemini 最新的大模型进展陆续公布，国内外的阶段和差距如何？

谭待：实事求是地说 OpenAI 肯定是世界第一，包括 anthropic、Gemini 也做得很好，要承认差距；但另一方面，有两点。第一，我们的模型在不断进化。一旦进化到一定程度，就有可能应用到上面。

为什么(字节)这么久才正式发布豆包？因为豆包已经到了大家可以普遍使用的程度，只有越来越多的人可以做更多的应用，反过来又能带动技术进步，形成正循环。

前天（5 月14日）OpenAI 在新闻发布会上，语音做得好不好对整个互动体验影响很大。模型可能很聪明，但说话像机器人。豆包和世界上最好的产品还是有差距的，需要一个追求的过程。目前追求速度还可以，用户越来越多。

#我是虎嗅商业、消费、机动组副组长黄青春，关注娱乐、社交、游戏视频等诸多领域。业内人士交流加微信:724051399，新闻线索也可以邮寄到。 huangqingchun@huxiu.com

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

列国鉴·俄罗斯｜记者观察：俄罗斯音乐底蕴如何？

视频号“成年”，带领腾讯赚钱

全集团欧再福:便利店需要创新，商品力等于创新力。

的确劝你不要随意喝加冰的饮料！(不是因为凉)

很多人都收到了这条短信！已经有人的手机号码突然被封了，更可怕的是…

项目推荐

AI云印侠

宾果智能

幸福绩效