大模“618”开启,阿里:我降价!百度:我免费!| 最前线

05-25 20:38

文|周鑫雨


编辑|邓咏仪


互联网大模型于2024年5月率先迎来“618”。



图片:周鑫雨


5月20日晚,阿里云在微信官方账号发布了一条“明天又发生了什么”的帖子,发布了降价风声——21日上午10:00,通义千问模型家族宣布降价,开源和闭源都有不同程度的限制和降价政策。


其中,Qwen是阿里云商业化的主要模型。-Long,从原来的20元/百万Tokens到0.5元/百万Tokens,输入价格下降了97%,甚至达到了97%。


这个价格,以0.0003元/千Tokens的细微优势,突破了5月15日字节刚刚发布的“豆包大模型”的输入地板价格:0.8元/百万Tokens。


不过,低价之王刚易位4小时,百度就来“掀翻价格地板”——文心一言两款ERNIE Speed和ERNIE Lite,直接宣布“免费”。


到2023年,模型降价仍然遵循训练效率优化和规模效应的自然趋势。


2023年11月,百度大模型平台“文心千帆”调整了相同汉字数量对应的Token数量,变相降低了模型价格的20%。相应地,文心大模型的推理成本降低到了原来的1%。


但是2024年模型价格战,几乎没有开战的预兆。


价格悬崖的开始,是一条名为“DeepSeek “V2”鲶鱼。在DeepSeek制作机构“深度追求”的背后,有一万多张英伟达A100。 量化GPU基金-幻方量化。


五月六日,DeepSeek大模型V2的深度追求发布。DeepSeekk作为模型领域的“黑马”,拥有2360亿参数。 V2,模型性能处于国内第一梯队,定价没有负担。支持32k左右的模型API定价仅为1元/百万Tokens(计算)。、2元/百万Tokens(推理),是当时百度文心4.0-8k推理价格(120元/Tokens)的1/60。


图片:周鑫雨


此后,大型独角兽智谱AI率先加入价格战。五月十一日,智谱AI旗下的GLM-3-Turbo,价格从5元/百万Tokens下降到1元/1元。Tokens。


另一方面,“黑马”扰乱模型定价,则是更具性价比的小模型被重新讨论。


很多从业者对智能的出现表示,小模型的潜力还没有完全挖掘出来,可以通过数据治理、效率提升等策略,对下游客户来说也是更划算的选择。


Meta于2024年4月22日发布的开源模型Llama-3,以70B的“小参数”和20倍以上的GPT-4为性能掰腕。随后,微软再次发布了Phi-3.8B模型 mini,GPT-3.5号称性能对比,也可以在苹果A16芯片上流畅运行。


对下游客户来说,昂贵的大型模型不够“香”。大型企业的集体降价,也是顺应市场选择的。


然而,即使价格打破了地板,大工厂仍然有利可图。大模型只是门面,大工厂的渔民意味着通过模型销售自己的云服务。


根据SemiAnalysis计算,DeepSeek每台服务器在计算率服务力利用率最高的情况下,每台服务器每小时收入可达35.4美元,毛利率超过70%。


但是对于被迫卷入价格战的小厂商和初创企业来说,收入压力会更大。2024年5月21日,零一万物CEO李开复直言不讳地表示,最新模式Yi-Large的API定价仍然是20元/百万Tokens。


未来,小厂只有在单点或多点功能上与竞争者拉开距离,才能得到蛋糕。


欢迎交流!


欢迎交流!


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com