全面出击字节AI:比行业平均便宜99%,豆包“大模型家族”正式开业

2024-05-19

作者 | 邓咏仪


编辑 | 苏建勋


这个星期可以算是大模型领域的又一次大战——上面有谷歌和OpenAI的互相狙击,国内也不甘落后。


一直保持低调的字节AI,全面攻击。5月15日,火山引擎抛出了从底座模型到上层应用的一系列更新,这是每年常规的“原动力大会”。


△来源:火山发动机


首先,品牌名称是统一的。原来的“云雀”模型现在改名为“豆包大模型”。火山发动机甚至搬出了“豆包大模型家族”的称号,包括底座模型,豆包一口气推出了9款模型。


与同行多尺寸、全特性的“专精”路线相比,豆包的底座模型思路更加简洁。


在这些模型中,豆包的主要模型分为通用模型pro和lite两个版本,每个版本都适合不同用户的使用需求。


此外,还有7种功能模型,包括角色扮演、语音识别、语音合成、声音复制、文生图等。


△来源:Dreamina


除基本模型外,火山发动机还发布了今年的成绩单:


现在,豆包大模型平均每天处理1200亿Tokens文本,生成3000万张照片。


“豆包App”是字节跳动的重点大模型应用,也是基于豆包大模型,是国内AI应用的“顶流”。火山发动机表示,在苹果App中 在AIGC类应用中,Store和各大安卓应用市场上,豆包App的下载量排名第一。


根据字节跳动产品和战略副总裁朱骏的说法,豆包上已经建立了800多万个智能体,每月活跃用户达到2600万。


此外,字节并没有改变“App工厂”的本色。在过去的一年里,除了主要的豆包App之外,字节跳动还基于大模型推出了互动娱乐应用“猫箱”和星画、即梦等AI创作工具。


△来源:火山发动机


底座模型“地板价格”,还可以再次降低


在新闻发布会上,火山发动机可以算是一个竹子。这说明在展示豆包模型家族时,火山发动机甚至没有提到太多参数和性能相关的内容,而是一上来就展示了价格:0.0008元/千Tokens。


它可以说是一种“地板价格”。


例如,全新的OpenAI模型GPT-4o,GPT-4o的价格已经到了5美元的输入。 / 百万 Token(约为0.035 导出15美元/千tokens / 百万 Tokens(0.1元/千tokens)。


而且国内大型模型厂家,均价在0.12元/千Tokens上下-豆包大型模型,比上述模型便宜很多。


“只有消耗大量,才能打磨出好的模型,大大降低模型推理的产品成本。根据火山引擎负责人谭待的说法,按照目前企业市场豆包大模型的定价,1500多个字的价格可以处理0.8%,比行业便宜99.3%。



△直接点名同行价格 来源:火山发动机


他还强调,这次降价是豆包的主要模式降价,而不是用小模式降价来混淆是非。例如,豆包通用模型pro-32k版本,模型推理的输入价格只有0.0008元/千Tokens。在市场上,同规格模型的定价一般为0.12元/千Tokens,是豆包模型的150倍。


也就是说,从“以分计费”到“以厘计费”的时代,大型行业。


为什么能实现大幅降价?谭待说:“一是我们能做到,二是我们需要这样做。”


一个原因是,从ChatGPT爆发到现在,大型底座模型已经进入稳定迭代阶段。无论是模型训练还是推理应用,都有很大的优化空间,成本迅速下降。


以火山发动机为例,谭待表示,在实践中,豆包的模型结构得到了很大的优化和提升;但是在模型工程中,比如之前采用的是单机推理方法,现在豆包采用的是分布式推理——可以理解为不同的AI计算需求可以通过底层不同的芯片来处理,从而大大提高了计算效率。


谭待在会后的采访中说,0.0008元/千Tokens“不是打价格战的价格”。作为字节跳动Tokens 火山的重要载体B,定价将遵循正常的商业逻辑,亏损补贴,无法获得长期的商业合作。


现在AI应用市场还处于发展初期,以前的大型模型使用价格仍然过于昂贵,这显然限制了应用的发展,这也是模型制造商降低价格的原因。


就中国市场而言,字节豆包App已经成为第一梯队的AI应用,但2600万月度活跃用户还远远没有达到“杀手级应用”的水平。谭待说:“大模型领域还没有达到竞争激烈的阶段。


根据QuestMobile的数据,截至今年3月,AIGC行业基于大模型的用户数量已达7380万,尽管同比增长8倍,但仅占移动互联网用户的6%。


从其他玩家的动作来看,2024年Q1,阿里巴巴云和腾讯云宣布大幅降价,但主要针对CPU的通用计算率,AI相关GPU计算率价格降价不多。


相比之下,字节并不是中国唯一打“降价牌”的厂商,而是最强调AI算率降价。潜在的原因是,作为云计算市场的后起之秀,字节更渴望AI带动的增量需求。


在这个时候,选择低价格来降低用户使用AI的门槛,覆盖更多的市场,也是合理的。


可以预见,今年国内大型底座模型的降价趋势还会继续。推理方面的成本还有很大的降低空间,国内模型厂商其实有很多技术实力。


举例来说,最近有消息称,国内私募量化巨头“幻方量化”发布的第二代Deepseek模型,基于框架创新,大大降低了推理成本,将API定价直接打到竞争产品的1/10甚至1/100,每百万token的输入只需1元。


“豆包”更像人,To B落地加快


不约而同,今年大厂发布的To C应用程序,越来越像“人”。这背后透露的信息是:AI助手,正以比我们想象的更快的速度向我们走来。


这是本周的几次大型工厂新闻发布会。首先,OpenAI发布的GPT-4o对话几乎没有延迟——用户可以随时打断和回答,就像电影一样。《Her》超级人工智能,它甚至可以通过“看”和“听”来判断顾客的情绪、状态,并给予回应。


而且在昨天的谷歌发布会上,Project 作为谷歌的第一个AI,Astra Agent商品,可以基于手机镜头,实时语音进行交互,也有“记忆”,这意味着与人类的交互可以更深层次。


豆包App在火山引擎这次发布会上发布的信息,也有很多共同点。


字节产品和战略副总裁朱骏表示,“我们为豆包定义了三个产品设计原则,第一个是“拟人化”。为了让产品更像人,豆包团队在ASR模型和超自然TTS音质上下了很大功夫,尽量做到类似与真人交谈的感觉。


以生活场景为例。五一假期,豆包真的像朋友一样陪他去旅游——在旅途中,豆包不仅根据恐龙博物馆和自贡井盐的形成提供了详细的解释。在饭桌上,当被问到“如何剥皮虾”时,豆包不仅回答了问题,还推了一段颤音视频——让他直观地看到了剥皮虾的技巧。


然而,就当今国产模型的进展而言,今天所展示的能力,只是AI智能体的第一步。


“现在大模型的能力在很多维度上令人惊叹,但在很多维度上也存在缺陷,同时也在快速演变,每三个月或六个月都会发生很大的变化。”朱骏说:“去年上半年,大模型回答10个问题时,可能会出现6个错误,但今年幻觉大幅下降,随着搜索引擎的增强,知识已经达到了可用的状态。当然,后期提升的空间还是很大的。”


现在应用落地比较多,还在B端。


随着“豆包模型家族”的出现,字节的AI版图已经有了很大的原型:火山引擎负责基础模型和开发者生态的构建。原来的To B服务,也是当今AI导出服务的抓手。与此同时,这个底座还支撑着字节内的许多AI应用。


从原来的To开始 就服务而言,火山引擎在模型应用方面的业务思路,大致可分为三个方面:


第一,确定性高,行业天花板高的场景,如手机、汽车等,这部分火山将与行业合作伙伴共同创造。


第二,对于一些不太明确的创新方向,火山将成为支持创业团队的服务提供商。


最终,开发者是火山特别重视的板块。火山不仅提供了一套完整的AI开发工具,还提供了语音功能的高互动、低延迟等高自由度模型开发模式和垂直场景所需的功能。字节有优势


在今天的新闻发布会上,火山发动机建立了两个生态联盟:手机和汽车。汽车领域的合作伙伴包括吉利汽车、长城汽车、捷途汽车、赛力斯、智己汽车等20多家厂商。


但是在手机领域,火山发动机的推动速度更快。大型服务已经悄悄进入了很多合作伙伴的产品,比如OPPO小布助手、荣耀智能办公智能助手、小米“小爱同学”、华硕笔记本豆丁AI助手等等。


以Oppo的小布助手为例。与豆包大模型合作后,通过业务数据进行调整。 Prompt,Oppo建立了多个垂域模型,真正使模拟面试、英语教学、情感聊天等场景得以实现。


火山的大型服务,在更广泛的公司场景中,已迅速使AI从POC(内部试点)阶段,进入真实的生产系统。


一个典型的例子是智能驾驶和智能驾驶舱之间的交互。在传统的自动驾驶计划中,人与汽车之间的交互仍然会有延迟和不确定性。


但汽车配备豆包lite大模型后,汽车厂商可以在低延迟下进行对话,支持多个驾驶舱智能助手场景,如聊天、搜索、娱乐、导航、车辆控制等。,效果比传统语音处理高50%以上。


△配备大型车机系统,询问附近的美食,会自动推送相应的抖音视频。 来源:作者拍摄


但是在字节内部,在过去的一年里,已经有50多家业务广泛使用豆包进行AI创新,包括抖音、头条、番茄小说等多种产品。


下一步,火山引擎将继续扩大公司端的场景。AI开发平台面向开发者的“纽扣”今天推出了公司标准版,公司版的纽扣将提供API。、事件推送,甚至纯代码的访问方式,使开发者能够访问AI。 在飞书等办公平台上部署Bot。


就企业而言,如今招商银行、海底捞火锅、超级猩猩、猎聘等公司,已经在纽扣上建立了智能体。


超级猩猩的智能身体开发了一个约课助手“猩猩同学的小同桌”,无代码,为用户提供个性化的健身建议,帮助用户约课。


△“猩同学的小同桌” 来源:火山发动机


在会议摊位上,字节还预测了未来的一些新功能——比如边缘云的Bot在会场摊位上运行,当AI 当Bot与场馆中的摄像头联动时,你可以告诉观众会场有多少人,哪个摊位最受欢迎。很快,AI模型也可以访问硬件,如机器人等各种智能产品。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com