大模型从烧钱到落地,到该“验收”的时候。

03-21 11:49

继通用大模型价格以厘计算之后,字节再一次将多模态大模型带入“厘时代”。


火山引擎于2024年12月18日举行。 Force 会上,字节跳动正式发布豆包视觉理解模型。与此同时,公布其价格为0.003元,相当于一元钱可以处理284张720P的照片。


比较claude 3.5 0.021元/千tokensSonnet,qwen-vl-0.02元/千tokensmax,GPT-0.0175元/千tokens4o,豆包视觉理解模型比行业便宜85元%。


而且在此之前的5月份,字节跳动发布的豆包大模型,其主要模型在企业市场上的价格是0.0008元/千Tokens,0.8厘可以处理1500多个汉字,比行业便宜99.3%,让大模型从分计费到厘计价。


这一操作迫使阿里巴巴云的三款主要通义千问模型再次降价,最高降幅达到90%。百度智能云直接宣布,文心大模型的两款主要模型ENIRE Speed、ENIRE Lite完全免费。


不到一年半的时间,字节如何在AI大模型市场落后?多模式大模型发展到哪一步?未来大模型技术在应用侧的新趋势是什么?


01.“卷王”豆包后来居上?


2023年是国内“大爆发”模式的一年。


从去年3月开始,许多大型企业和创新型企业都出现了自研大型商品:阿里通义千问1.0、腾讯混合元、360智能大脑、华为盘古、科大讯飞星火、商汤日新、百川大模型、智谱AIGLM等。都起源于今年。


作为AI起步较晚的玩家,字节直到去年1月才成立大型R&D部门,8月份才发布“云雀”大型模型和“豆包”对外测试AI对话产品。



尽管来得晚,但是架不住别人涨得快。


根据量子位智库的数据,截至11月底,2024年豆包累计用户数已超过1.6亿;11月份,平均每天有80万新用户下载豆包,每天有近900万活跃用户,仅次于OpenAI的ChatGPT,位居世界第二,国内第一。


据字节跳动公布的数据显示,截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿元,比7个月前第一次发布时增加了33倍。


没有字节这个“卷王”的大力推动,“豆包”就能如此成长。


第一个是卷流量。


据App 截至11月15日,Growing统计,Kimi、国内十大大型商品,如豆包、星野等,共投放超过625万条广告,投放金额达到15亿元。在这两种商品中,Kimi和豆包是最疯狂的两种,分别投放了5.4亿元和4亿元。



目前,花钱购买是AI产品启动最直观、最快捷的方式。但在各种交付渠道中,字节的巨型引擎(字节跳动旗下的广告交付平台,包括今日头条、抖音、西瓜视频等营销资源)基本不可或缺。


这使得背靠字节的豆包最大限度地发挥了流量池的优势。在Tiktok中,字节几乎屏蔽了除了豆包之外的所有AI应用,只留给自己的豆包。虽然不确定巨额投资是否能获得超级应用,但至少给豆包带来了肉眼可见的用户增长。


其次是卷货。


从聊天助手、视频工具到娱乐应用、办公等领域,字节相继推出了十几个。 AI 应用程序,覆盖绝大多数主要应用程序 AI 产品方向。今年10月,字节还推出了一个可以和豆包语音对话的 Ola Friend 近期仍在研发耳机 AI 眼镜。


这种饱和的R&D,一方面可以加速豆包大模型依靠多种AI应用的迭代;另一方面,预计AI硬件终端可以拓宽豆包大模型的使用场景,从而实现整个“豆包” ”产业链闭环。


另外,豆包还在卷曲的场景中,以求在使用上多开花。


据了解,豆包模型已与80%的主流汽车品牌合作,接入多个智能终端,如手机和PC,覆盖约3亿台智能终端。半年内,来自智能终端的豆包模型数量增加了100倍。最近三个月,大豆包模型在信息处理场景中的调用量增加了39倍,客户服务和销售场景增加了16倍,硬件终端场景增加了13倍,AI工具场景增加了9倍,学习和教育场景也大幅增加。


可以说,丰富的内部生态、持续的资源投入、庞大的优质数据和应用领域,以及全面接入AI、相互开放,是豆包成为行业“卷王”的秘诀。


02.下半场开始争夺多模态。


自 OpenAI 推出 Sora,使“一句话生成视频”成为可能;谷歌发布 Gemini ,国内主要公司能够无缝地理解、操作和组合不同类型的信息,开始相继跟进、布局视频、音乐、语音等多种模式。 AI 应用。


例如,从今年5月开始,生数科技Vidu、快手可灵、字节即梦、智谱清影、商汤Vimi等相继发布文生视频模型;九月,MiniMax正式发布视频模型video-01、在云栖大会上,阿里云发布了通义万相全新的视频生成模型,美图宣布MiracleVision大模型升级了视频生成能力;腾讯混合元大模型正式推出视频生成能力,而月亮暗面旗下的Kimi则被曝出“Kimi创作空间”正在测试AI视频生成功能。...多模态的“多”逐渐成为新的发展方向。



根据介绍,火山发动机发布的豆包视觉理解模型的主要能力包括:


内容识别能力更强:不但能识别出物体类别、形状等基本要素,还能理解物体之间的关系、空间布局以及场景的整体含义。


更强的理解和推理能力:不但可以更好地识别内容,而且可以根据所识别的文字图像信息进行复杂的思维计算。


视觉描述能力更加细腻:在图像信息的基础上,可以更加细致地描述图像所呈现的内容,也可以进行多种文体的创作。


继 GPT-4 在英语角度的里程碑式突破之后,业界普遍认为“视觉”是下一个爆发的赛道。毕竟,人类的五种感官中有 80% 这是一种视觉信息,未来的大模型也应该充分利用更多种类的感官,从而探索实现。 AGI 的路径。


火山发动机总裁谭待也在接受采访时表示,推出视觉理解模型相当于解锁了一个大场景。与过去只有文字对话的AI相比,聊天功能与深度推理、图像视觉理解等能力的结合,可以帮助模型处理现实世界中的大量综合信息,帮助人类完成一系列复杂的工作。


比如在旅游场景中,帮助游客看外语菜单,讲解照片中建筑物的背景知识;在教育场景中,提高学生的作文和科普知识;在办公场景中,模型不仅可以识别内容,还可以帮助客户分析图表中的数据关系,处理代码逻辑。



此外,火山引擎不仅推出了视觉理解模型,还推出和升级了许多其他模型。例如,豆包通用模型pro已经完全对齐了GPT-4o。;音乐模型从60秒的简单结构升级为3分钟的完整作品;2.1版本的文生图模型访问即梦AI和豆包App。...


可以看出,豆包系列的大模型虽然相对于市场上的同类产品发布时间不早,但一直保持着更快的更新速度,通过即梦AI获得最新能力。、应用,如豆包App,对普通用户快速开放。


而当下,AI 市场关注的焦点正从“大模型”逐渐转变为“大模型” "。除常规的外 AI 文字对话类应用,多模式的“多”逐渐成为新的方向。


03.该“验收”时,大模型就到了。


百度创始人李彦宏在2024年世界人工智能大会上在演讲中提到,“2023年,中国出现了百模对决,这实际上造成了社会资源的巨大浪费,尤其是计算能力的浪费。”的确,无论是技术研发成本还是应用成本,真金白银的支持对于大模型的发展每一步都是不可或缺的。


目前,随着行业回归理性,越来越多的AI企业意识到,卷参数、卷Token数、卷集群规模和卷价意义不大,大模型的商业化是最重要的问题。


根据终端用户类型,AI大模型的商业模式可以分为to C、to B。


lto C:也就是说,面向个人客户,包括免费和付费订阅模式。腾讯元宝、百度文心一言(3.5版)等免费模式;百度的文心一言(4.0版)等付费订阅模式、OpenAIChatGPT(4.0版本);


lto B:也就是说,面向企业,包括API调用授权、SaaS模式。在API调用授权模式下,企业客户可以将AI功能集成到自己的应用程序或服务中,通常根据调用频率或信息量收费,如阿里通义千问、智谱AI等。;大模型公司在SaaS模式下为用户提供软件服务,用户不需要安装和维护软件,例如Google Cloud AI。实际应用中,大型企业一般采用多种商业模式混合使用。



目前多模态大模式竞争火爆,将带动众多行业重塑生产环节,必将在以下几个领域引发新一轮的升级与竞争:


影音创作:当大模型从单模态生成转变为多模态生成时,AIGC的应用降低了专业创作的门槛,这将改变视听传媒行业的生产模式,创造新的内容生产模式,提高创作效率,扩大创作空间,提高作品质量。


情绪智能:GPT-4o和Gemininini等基于最新的AI模型。 1.5 Pro,未来,AI公司将采用流动语音识别、多模式AI和情绪计算等技术,大大提升互动体验。这意味着多模式模型将赋予机器情感价值,通过对客户情绪和行为的深入分析,满足用户多样化的公司需求。


工业智造:未来多模式大模型有望与目前广泛使用的专用小模型相互补充,深度赋能工业制造的各个环节。随着场景数据的整合和积累,感知和理解能力将进一步升级,以满足生产制造中的个性化需求,从而促进工业产业变革。


总之,如今AI领域的竞争核心已经从“是否有对抗”的大模式转变为“应用对抗”。在这个阶段,竞争的不再是宏观概念,而是落地能力和商业化的进步。


随着国内大型模型的不断迭代和升级,国内GPU供应问题的叠加逐渐减少,政策的牵引等。预计国内大型模型培训计算能力的需求将逐步释放,这不仅将进一步加快大型模型的应用,还将为AI时代带来新的行业机遇。


本文来自微信微信官方账号“DoNews”(ID:ilovedonews),作家:文林,编辑:杨博丞,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com