低价格“杀”大模型

05-26 16:49

最近几天,大模型的价格战如火如荼。百度、科大讯飞、腾讯甚至直接宣布免费降价。


五月六日,DeepSeek发布了第二代MoE大模型DeepSeek-V2,能力对比 GPT-4、llama 3-70B,价格是每百万。 tokens 输入输出分别为1 块和2元,GPT-4 近百分之一的Turbo价格。


DeepSeek成了降价潮的开始。


随后,智谱AI首次跟进。5天后,智谱AI宣布GLM-3-入门级商品。 从5元起,Turbo模型调用价格/百万tokens 降到1元/百万tokens,减幅达到80%。


五月十五日,在火山发动机原动力会议上,字节跳动释放了豆包0.0008元/千Tokens的极低定价,将模型价格直接融入“厘元”时代,可以说将大模型“低价”拉到了高潮,价格战的火焰至今已燃烧。


五月二十一日上午,阿里云直接抛出重磅炸弹,正面回应豆包降价:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens下降到0.0005元/千tokens,狂降97%。比豆包大模型0.0008元/千tokens低0.0003元/千tokens。


当日下午,百度更直接宣布文心大模型两大主要模型全面免费,立即生效。


第二天上午9点,科大讯飞也紧急跟上,官网宣布讯飞星火Lite。 永久免费开放API。


下午5点,一向不着急的腾讯也宣布了混合元-lite模型,API输入输出总长计划从目前的4k升级为256k,价格从0.008元/千tokens调整为全面免费。


到目前为止,国内所有大型头部玩家都加入了价格战。


从卷参数到卷长文本、卷Agent,再到现在卷低价,国内大模型的发展似乎是东锤,西锤,什么热追,一个新家,其实有一条非常明确的主线——应用和商业化。


这一次,每个大模型都参与了价格战。原因是每个家庭都在探索大模型的商业化路径。总的来说,目前实现大模型的方式只有两种,C端付费,赚普通用户的钱;B端API收费,从公司赚钱。


就国内环境而言,用户的付费观念并不强。看完《生活的乐趣》,你会找朋友借各种VIP和SVIP,更不用说用户买一个不完美甚至有点“鸡肋”的大模型产品了。


目前C端市场上只有百度的文心一言、字节豆包、阿里的通义千问、月亮暗面的Kimi声音很大。


文心一言早已开启了客户付费模式,而且价格也不低,连续包年会费近600元,根据百度最新披露,文心一言用户数已超过2亿。


最近,Kimi也在为试水用户付费。与文心的订阅制度不同,Kimi选择了奖励制度。月亮的阴暗面之所以另辟蹊径,可能与年轻用户数量有关。



所以,B端成了各大模型企业争夺的核心焦点。对于企业而言,使用“人工智能” “新质量生产力的发展是必然趋势,这不是选择题,而是必须要回答的问题,但现实是,大型模型太贵,模型应用成本太高。


火山发动机总裁谭待提到:“现在大模型还是太贵了,模型的应用成本不应该是这样的。(通过)降低成本,让大家更好的尝试各种创新,整个行业都会崛起。”


有业内人士表示,今年以来大模式降价已经成为一种趋势,将进一步加快应用端的落地。


看起来大模型迎来了平价时代,但事实真的是这样吗?


究竟谁更具性价比?


大型工厂API动不动厘元/千Tokens,甚至很多公司都打出了“免费”的口号。


然后,这些看似低价、免费的大模型,真的做到了“便宜好用”,或者说只是为了获得客户,有我优秀的竞争心态。


这次字节降价的是豆包通用模型pro-32k版本,模型推理的输入价格为0.0008元/千Tokens。而且市场上同规格模型的定价一般为0.12元/千Tokens,是豆包模型的150倍。


Qwen通义千问GPT-4级主力模型-Long,从0.02元/千tokens到0.005元/千tokens,API输入价格暴跌97%。Qwen-Long是通义千问的长文本增强模型,其性能与GPT-4相比,前后文长达1000万。


ERNIE,百度官方公布的两款主要模型。 Speed和ERNIE Lite 前后8K和128K的长度都是免费的。


讯飞星火Lite 永久免费开放API,讯飞星火顶配版(Spark3.5 Max)低至0.21/万Tokens的API价格。


混元-lite模型是腾讯混元的主要模型之一,API输入输出总长计划从目前的4k升级为256k,价格从0.008元/千tokens调整为全面免费。


经过深入研究,字节、阿里的低成本模型、百度、科大讯飞、腾讯的免费模型都是轻量级模型版本,核心大规模、高性能模型并没有卷入这场价格战。


这场看似热闹非理性的价格战背后,似乎更多的是大型厂商想用“互联网”时代吸引更多的TOB客户和开发者。


事实上,从另一个角度来看,这种“低价”不仅是大厂商获得客户的“饵料”,也是大池塘的“营养”。


水大鱼大,如果回放互联网的发展历史,我们会发现,在苹果手机推出几年后,抖音真正成为了一个超级应用,一个是4G的普及,一个是安卓千元机的普及。


新技术浪潮来临后,一开始并不完善,需要达到一个临界点才能爆发,而这一点的核心就是普惠点。


对大型模型而言,大型模型要想落地,想要迅速进入“价值创造阶段”,首先要让大家能够负担得起。


一切都是商业化的?


事实上,随着技术的发展,模型推理的价格下降是可以预见的必然趋势。大模型还处于起步阶段,远没有达到残酷竞争的水平。未来模型推理的成本肯定会继续下降。


比如豆包模型选择分布式推理和混合调度,充分发挥各种异构算率,处理推理算力问题,从而降低模型推理成本;腾讯混合元模型选择混合专家模型 (MoE)构造,自研 Angel 与行业主流框架相比,机器学习平台的训练速度是主流框架的2.6倍,推理成本降低70%。


最近,纳德拉还在微软Build开发者大会上提到,GPT-4在过去一年中的性能增长了6倍,但是成本降低到了之前的1/12,相应的性能/成本增加了70倍。


在最近的一次记者采访中,李开复提到:“我认为整个市场每年降低10倍的推理成本是可以预期的,而且必然会发生。”


谈到降价的原因,一方面,字节和阿里云都表示希望降价能加速AI应用的爆发。


目前,大型应用的发展还处于起步阶段,并没有爆款应用。根据QuestMobile的数据,截至今年3月,AIGC行业基于大型的用户数量已达7380万,尽管同比增长8倍,但仅占移动互联网用户的6%。


所以,通过降低价格,公司希望能吸引更多的开发者和客户参与其中,共同推动AI应用的普及与发展。


猎豹移动董事长兼首席执行官傅盛也表达了类似的观点。他认为,降价的目的不是为了吸引开发者,而是为了吸引更多的客户。目前各大模型的应用基本都是免费的,但是用户数量不能增加。大家都意识到,仅仅提供聊天窗口是不可能让用户越来越多地使用的,所以开发者必须参与其中。


有些网友调侃,大模型降价,压力给应用端,看谁先做应用,先推动客户AI转型升级。


在李彦宏看来,AI应用与基础大模型的发展息息相关。“应用的进步可以促进基础模型的创新,也有助于加速从互联网时代向人工智能时代的转变。”


另一方面,作为AI的关键基础设施,各大企业都希望通过低价或免费快速占领市场,构建生态,形成客户依赖。


据预测,中国所有大型公司API的日调用量将在年底增长100倍,从目前的不到1亿增长到100亿。每个人都不想错过这个巨大的增长潜力。


另外,实际上从另一个角度来看,这场价格战之所以能够打起来,而且价格拉不开差距,是因为各种技术路径很难拉开距离。


模型能力和后续服务和体验仍然是大模型成功的关键因素。百度曾经说过:“使用大模型不仅要看价格,还要看综合效果。只有使AI的应用效果明显,响应速度更快,分销渠道更广,人们才能真正感受到AI给社会生产带来的便利。”


假如只是为了低价而降价,那么很可能会陷入OFO式的价格战玩法,最终落得两败俱伤。


大型卷价格低,创业公司伤不起


大厂大模型价格战如火如荼,创业公司安静。虽然DeepSeek和智谱AI也进入市场,但大多数大模型创业公司并没有加入降价潮。


李开复明确表示,他将无法参加价格战。而且认为100万token花十几块钱或者几块钱没有太大区别。对于要求最高、需求最高的,大家还是会选择最好的模型。


同时,王小川也认为,降价并非创业公司的事,百川也不会“掺杂”价格战。


他解释说,现在的To B不是百川的主要商业模式,价格战对其影响有限,百川的精力更多,仍将投入超级应用。


诚然,每个初创公司都有不同的定位和不同程度的价格战对他们的影响。然而,一个不争的事实是,价格战必然会导致资源集中在少数头部企业。对于初创企业来说,他们需要寻找新的商业模式来实现高质量的发展,才能面临更大的成本压力。


傅盛表达了同样的焦虑,他认为这一次,大规模降价基本宣布大规模初创企业必须寻找新的商业模式,下降最猛的是有云服务的大企业,通过大模型获得云客户,羊毛出在猪身上,可以下降。大型初创企业没有这种生态,必须另寻商业模式。


无论是百度、阿里、腾讯还是字节,降价背后都有“公共云” 大型API带来的边际成本降低,而对初创企业来说,无论是烧钱能力还是其它都无法与之抗衡。


一般来说,价格战和泡沫一起出现。在某些情况下,价格战通常会挤出一些泡沫。滴滴、OFO等价格战要么挤出规模小、资金不足的竞争对手,要么挤出自己。


正如王小川所说,降价是一种优势,但不一定是竞争力,价格战将加速泡沫周期,最终企业可能会消失。


本文来自微信微信官方账号“AI大模型工厂”(ID:AIGCMakting),作者:星奈,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com