大模“618”开启，阿里：我降价！百度：我免费！| 最前线

2024-05-25

文｜周鑫雨

编辑｜邓咏仪

互联网大模型于2024年5月率先迎来“618”。

图片：周鑫雨

5月20日晚，阿里云在微信官方账号发布了一条“明天又发生了什么”的帖子，发布了降价风声——21日上午10:00，通义千问模型家族宣布降价，开源和闭源都有不同程度的限制和降价政策。

其中，Qwen是阿里云商业化的主要模型。-Long，从原来的20元/百万Tokens到0.5元/百万Tokens，输入价格下降了97%，甚至达到了97%。

这个价格，以0.0003元/千Tokens的细微优势，突破了5月15日字节刚刚发布的“豆包大模型”的输入地板价格：0.8元/百万Tokens。

不过，低价之王刚易位4小时，百度就来“掀翻价格地板”——文心一言两款ERNIE Speed和ERNIE Lite，直接宣布“免费”。

到2023年，模型降价仍然遵循训练效率优化和规模效应的自然趋势。

2023年11月，百度大模型平台“文心千帆”调整了相同汉字数量对应的Token数量，变相降低了模型价格的20%。相应地，文心大模型的推理成本降低到了原来的1%。

但是2024年模型价格战，几乎没有开战的预兆。

价格悬崖的开始，是一条名为“DeepSeek “V2”鲶鱼。在DeepSeek制作机构“深度追求”的背后，有一万多张英伟达A100。量化GPU基金-幻方量化。

五月六日，DeepSeek大模型V2的深度追求发布。DeepSeekk作为模型领域的“黑马”，拥有2360亿参数。 V2，模型性能处于国内第一梯队，定价没有负担。支持32k左右的模型API定价仅为1元/百万Tokens(计算)。、2元/百万Tokens(推理)，是当时百度文心4.0-8k推理价格(120元/Tokens）的1/60。

图片：周鑫雨

此后，大型独角兽智谱AI率先加入价格战。五月十一日，智谱AI旗下的GLM-3-Turbo，价格从5元/百万Tokens下降到1元/1元。Tokens。

另一方面，“黑马”扰乱模型定价，则是更具性价比的小模型被重新讨论。

很多从业者对智能的出现表示，小模型的潜力还没有完全挖掘出来，可以通过数据治理、效率提升等策略，对下游客户来说也是更划算的选择。

Meta于2024年4月22日发布的开源模型Llama-3，以70B的“小参数”和20倍以上的GPT-4为性能掰腕。随后，微软再次发布了Phi-3.8B模型 mini，GPT-3.5号称性能对比，也可以在苹果A16芯片上流畅运行。

对下游客户来说，昂贵的大型模型不够“香”。大型企业的集体降价，也是顺应市场选择的。

然而，即使价格打破了地板，大工厂仍然有利可图。大模型只是门面，大工厂的渔民意味着通过模型销售自己的云服务。

根据SemiAnalysis计算，DeepSeek每台服务器在计算率服务力利用率最高的情况下，每台服务器每小时收入可达35.4美元，毛利率超过70%。

但是对于被迫卷入价格战的小厂商和初创企业来说，收入压力会更大。2024年5月21日，零一万物CEO李开复直言不讳地表示，最新模式Yi-Large的API定价仍然是20元/百万Tokens。

未来，小厂只有在单点或多点功能上与竞争者拉开距离，才能得到蛋糕。

欢迎交流！

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。