字节终于掀起了桌子

05-23 02:56

低调潜行一年多的字节跳动,终于憋住了一个大招。


5 月 15 日本,字节跳动首次向大众“推销”。 AI 大模型——其自研豆包“全家桶”官方宣布将采用火山引擎(字节六大业务领域之一),其他五个领域分别是视频、大理教育、飞书、朝夕。TikTok)提供外部服务。


到目前为止,字节跳动纵身跳入国内大模型混战,其大模型版图正式暴露。


图表:豆包大模型“全家桶”


由于字节已经越过了模型效果、推理成本、落地难度这三个最关键的门槛,所以出手就是“王炸”。


第一,AI模型效果 落地是最关键的,好的模型只有大量的使用才能打磨出来——根据火山引擎的官方数据,经过一年的迭代,大豆包模型正在成为中国使用量最大、应用领域最丰富的模型之一,日均处理 1200 亿 Tokens 文本,生成 3000 万张照片。


另外,字节跳动产品和战略副总裁朱骏透露,豆包平台每月活跃用户达2600万,已经超过2600万。 800 建立了一万个智能体。作为对比,QuestMobile 资料显示,到今年为止 3 月亮,豆包(字节跳动)、文心一言(百度)、天工(昆仑万维)、讯飞星火(科大讯飞)、Kimi 智能化助手(月暗面)位于 AIGC APP月活 TOP5——令人恐惧的是,豆包上线仅三个月就完成了用户反击。



信息来源:QuestMobile 统计


在这背后,虎嗅了解到,在过去的一年里,字节跳动通过拆解明确了各部门。 OKR(例如抖音主要负责拉新,字节主要负责拉新, AI 产品的 Flow 部门负责开发和产品增长)完成了部门之间的互不干扰,解决了互联网企业快速扩张面临的组织协作问题,这是中国的梦想。 AI 在互联网企业中,最明确的战略之一。


值得注意的是,豆包大模型(本名:云雀)先于 2023 2008年在字节内完成上线,并基于豆包大模型打造。 “豆包”AI对话助手、AI 应用开发平台“纽扣”、“猫箱”、星绘、即梦等互动娱乐应用 AI 创作工具,并将大模型连接到字节跳动的旗下,如抖音、番茄小说、飞书、剪影等。 50 多个业务,用来提高效率,优化产品体验。


“技术正在快速进化,但用户的核心需求没有改变,如高效获取信息、提高工作效率、自我表达、社交娱乐等。字节做了很多探索,找到了适合大模型应用的形式,希望自然交互能进入更多人的日常生活。”朱骏说。


那不是盲目的乐观,IDC 发布的《2024 AIGC 应用层十大趋势白皮书预测,2024 全球每年都会出现超越 5 亿次新应用,相当于过去 40 当年出现的应用数量总和,智能应用将呈现爆发式增长,大模型浪潮将加速渗透到人们的日常生活中。


第二,降低推理成本是大模型快速进入“价值创造阶段”的关键因素。


例如,腾讯混合元模型选择混合专家模型 (MoE)构造,自研 Angel 机器学习平台,训练速度达到主流框架 2.6 与行业主流框架相比,推理成本降低。 70%;OpenAI、最近智谱大模型也都降低了大模型的价格。


然而,当火山发动机总裁谭待宣布主要的豆包模型(小于等于等于 推理输入价格仅为32K) 0.0008 元/千 Tokens 当时,人们还是会感到惊讶——要知道,市场上同规格模型的定价一般都是 0.12 元/千 Tokens,而且豆包的主要模型比行业便宜 99.3%。




按照这个价格,8 可以买到一元钱的豆包模型 1000万 Tokens,大概 1600 万只汉字——它正以“价格屠夫”的姿态突破大型市场,被外界戏称为“拉响大模型市场价格战第一枪”。


对于这一点,谭待表示,背后有两个原因:“一是可以做到,二是需要这样做;主力模型比行业便宜 99.3% 可以在技术上实现,未来还有很多方法可以降低成本。


最后,豆包分布式推理也有混合调度,充分发挥各种异构率,解决了推理计算能力的问题,从而将模型推理的成本降低到非常低的水平。


“以前公司担心创新。 ROI 打错了,一是创新项目。 90% 会失败,其次,创新会根据消耗来创新。 100 亿 Tokens 算就要80 万;现在的费用只需要 8000元,失败也花不了多少钱,但是还剩下。 10%的项目成功后可以赚回所有的投资,这无疑可以帮助更多的公司轻装上阵,无负担投身。 AI 谭待说:“浪潮。


当然,字节愿意为企业“搭建平台”的深层次原因是,移动互联网行业已经到了客户和流量达到顶峰的成熟阶段,监管将更加注重产业互联网的推广和建设,这意味着技术将来到平台重构生态的关键时期。


就像美团创始人兼一样 CEO 当初王兴讨论过 BAT 在竞争关系中,如果把竞争这个词放在一起,就会变成惯性思维。“麦克阿瑟将军在西点军校告别演讲。”Only the dead have seen the end of war"(只有死去的人才能看到战争的结束),战斗只是从一个战场变成另一个战场,由一次机会转变为另一次机会,总是在不断变化。”


尤其,ChatGPT 出现让整个互联网躁动不安,追逐大模型的浪潮让互联网陷入混战的焦虑状态,而心中有老虎的企业正在寻找向上攀登的入口——当通用人工智能时代呼啸而来,字节手握网络层和数据层的独特优势,Tiktok拥有丰富的数据素材和充足的算率资源。在快速发展时期,必须果断投入(包括技术生态迭代、R&D投资等),才能赢得未来的机票。


下面是虎嗅和火山发动机总裁谭待两次(5次) 月 15 日、5 月 16 日)交流记录(部分表述因为阅读方便需要删除):


为什么字节要降低价格?


Q:业内有声音说大模型算率资源匮乏,为什么字节愿意大幅度降价?


谭待:一般来说,计算率资源不够就是训练,但是今天提到的大模型。 ToB 服务主要是推理。只要技术基础做得好,就可以用各种异构算率来满足性能,减少延迟,解决算率瓶颈。豆包分布式推理也有混合调度,就是通过调度各种异构算率来解决推理算力的问题。


第二,处理算率也解决了成本问题,可以将模型推理成本降低到很低的水平。以前公司担心创新 ROI 打错了,一是创新项目。 90% 会失败,二是创新试错贵(根据消耗 100 亿Tokens 算就要80 万);现在试错成本降低了 8000元,失败成本可以控制,只要剩下。 10%的项目可以实现,可以赚回所有的投资,也可以让很多公司轻装上阵,无负担投身。 AI 浪潮。


Q:在这个阶段,字节将价格卷入了以厘为单位的低价,这对整个市场有好处吗?


谭待:自然,很多企业可以以较低的成本进行各种创新,对于做大型企业家来说,没有一个是靠做大型企业的。 ToB 赚大钱,通过 ToB 服务不能循环自己的大模型。现在还是一个特别早期的阶段。最重要的是把蛋糕做大,先做普惠。


Q:字节能压低了同行的价格 豆包99.3%的性能和成本如何?


谭待:现在模型应用落地时,精调是关键,豆包 pro 支持 128k 可以调整。豆包的主要模型可以和所有的主要模型进行比较。网上可以看到很多第三方测试,拿豆包。 就APP而言,今天的月活 2600 万,用户越多调用量越大,模型自然就越好。


关于费用问题,ToB 业务取决于长期。用亏损换取利润是不可持续的。字节从来不走这样的路。降价源于技术自信。这个定价就是火山对技术有信心,未来还有很多方法可以继续降低成本。


Q:大型豆包完全打下了价格,为什么说“低价”是对技术的信心?


谭待:首先,技术上有很多方法可以降低成本,使效果明显,比如优化和改进模型结构;其次,在项目之前,是单机推理,现在是分布式推理,自然可以更好的利用各种底层算率,从而大大降低成本。特别是调度量很大之后,不同的负荷可以作为混合调度,大大降低了成本。并且,OpenAI 同时也在降价,想象未来大模型在人们的日常生活中每天都在使用,低价是真正广泛使用的前提。


其次,今年大模型能力明显提升,应用越来越重要。很多客户都想尝试做大模型,但由于价格(AI试错和业务创新风险高),他们不得不面对很多不确定性,试错成本必须降低得很低,这将被大家(公司和个人开发者)广泛使用。所以,目前最迫切的就是降低成本。




Q:在字节内使用豆包大模型的产品怎么样?


谭待:首先,同名 APP 到今年为止,豆包 4 月份,豆包在苹果中国。 App Store 效率排名第一;其安卓市场累计下载量 1.37 亿,在 AIGC 类应用中断崖式领先用户数量(月活达到 2600 万)表示效果很好,还有星画这样的创新应用。


除了 AI 除了原生应用,Tiktok、头条、飞书的一些功能都使用了大模型。比如Tiktok搜索和头条搜索结果都是用大豆包模型生成的,可以进一步询问客户想知道什么信息。许多营销文案、导购、助手等领域都应用于Tiktok电子商务。


除这些应用领域外,传统的许多应用领域 NLP(自然语言理解)解决的问题豆包也能做得更好,可以大大提高一些业务后台操作的效率。


Q:人工智能落地场景非常重要,火山有哪些客户应用领域可以共享?


谭待:移动电话的互动场景太多了,手机搜索,助手AI 等(OPPO 小布助理,荣誉智能办公助理,小米“小爱同学”、华硕豆叮 AI 所有助手都接入了火山发动机的大模型服务);现在有很多汽车。导航顺便看看商业区、餐厅和周边电影院。(玩手机不方便的时候)模型会告诉手找出相应的内容,完成互动;比如汽车驾驶舱对模型能力要求不高,适用于通用的豆包模型 lite,不但推理价格较低,延迟也较低 50%。


当然,一方面要提高场景落地的技术,比如 pro、lite、角色扮演和语音都有广泛的使用场景;另一方面,应用生态是一群人的群体智慧。只有模型更好,成本更低,更容易落地,生态才能繁荣。大企业代码高,但个人开发者想要的是低代码,只有门槛低才能做到,形成。 AI 时代创新。


字节蓄气,“火山”爆发?


Q:如何看待网络大佬在模型赛道上的残酷竞争?


谭待:国内的大模型还没有谈竞争,因为大模型还处于起步阶段,池塘有多大,鱼有多大,大模型市场才刚刚开始。这个时候,重点是做好大模型,做好应用,降低成本,让更多的人和企业受益。现在竞争还没有激烈。


Q:在此之前,周鸿祎和李彦宏就开源和闭源进行了讨论,火山会朝开源还是闭源发展?


谭待:首先,对于模型公司来说,开源闭源不是非黑即白,而是一种综合的方式。我们也在讨论未来某个版本或尺寸模型是否会使用开源。其次,公司模型的应用是开源还是闭源,本质在于背后的需求,是担心安全、成本还是服务。


Q:因特网大厂商在云计算领域竞争激烈,大模型在云计算领域的应用将重点放在哪些方面?


谭待:云生态包含 IaaS、PaaS、SaaS,AI 大模型本身就是云的锦上添花,就是把数字化做得更深更广。比如模型推理可以通过云的方式降低成本,所以从价格上考虑。 AI 就是建立一种算率与智能的相关性,将越来越多的数字化需求、生活场景与算率相结合。


火山当然更加重视火山 ToB方向:一是有些行业非常集中,比如手机、汽车可以通过联盟一起做好;第二,有些行业不是特别清晰,所以和最有想法的公司深度合作;第三,开发者非常重要。在新技术浪潮面前做出不同创新的不是过去的巨头,而是新的开发者,怎样服务好他们,让他们做得更好? AI 应用非常重要。


而且,作为一个公共云,字节的概念是要低成本。就像电商要高质量低价一样,降低成本是提到火山引擎的愿景。不知道别人有没有写,这是认知上的区别。


Q:字节具有数据优势,在文生视频这方面是否有布局实现弯道超车?


谭待:有一种字节产品即梦(Dreamina),除了文生图,还有一些短视频生成功能。模型训练一定要技术扎实,本质上不会有弯道超越;其他模式也是如此。首先,我们应该做好基础工作。如果基础做不好,文生图就是‘人工智障’——因为连文字都看不懂,视频能好到哪里去?所以没有弯道超越,要循序渐进。


虎嗅注:事实上,2023年字节跳动 年 11 已经发布了视频生成研究成果。 PixelDance,在文本指导的基础上提出 头尾帧照片指导的技术方法,可以生成高度一致、动态丰富的视频;今年 1 月亮,字节再次发布视频生成模型 MagicVideo-V2,效果比肩 SVD-XT、Pika1.0、Gen-2(Runway) 类似的模型。


Q:近期 OpenAI(GPT-4o)、谷歌(谷歌I/O大会升级) Gemini 最新的大模型进展陆续公布,国内外的阶段和差距如何?


谭待:实事求是地说 OpenAI 肯定是世界第一,包括 anthropic、Gemini 也做得很好,要承认差距;但另一方面,有两点。第一,我们的模型在不断进化。一旦进化到一定程度,就有可能应用到上面。


为什么(字节)这么久才正式发布豆包?因为豆包已经到了大家可以普遍使用的程度,只有越来越多的人可以做更多的应用,反过来又能带动技术进步,形成正循环。


前天(5 月14日)OpenAI 在新闻发布会上,语音做得好不好对整个互动体验影响很大。模型可能很聪明,但说话像机器人。豆包和世界上最好的产品还是有差距的,需要一个追求的过程。目前追求速度还可以,用户越来越多。


#我是虎嗅商业、消费、机动组副组长黄青春,关注娱乐、社交、游戏视频等诸多领域。业内人士交流加微信:724051399,新闻线索也可以邮寄到。 huangqingchun@huxiu.com


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com