Claude性能下滑价格上涨，Opus跌落神坛

04-18 06:57

Claude性能下降，已成为重度用户热议的话题。

发现这一问题的是AMD高级总监Stella Laurenzo。

她分析了近7000份会话日志后指出，现在的Claude处理复杂任务时表现不佳。

第三方跑分数据也证实了这一点，原本排名前2的Claude，几周内就跌到了第10位。

用户们支付同样的订阅费，却使用着性能下降的模型，感觉自己被欺骗了。

Claude性能下降被发现

Stella对Claude Code的运行数据进行了详细检查。

她分析了6852份会话文件、17871个思考块和超过23万次工具调用。

结果显示，从2月份开始，模型的推理能力大幅下降。

在处理复杂工程任务时，它不再可靠，经常出现逻辑问题或无法理解复杂指令。

原本认真解决问题的助手变得敷衍，用简单方法应付，甚至中途停止任务。

第三方基准测试BridgeBench中，Opus 4.6的准确率从83.3%降到68.3%。

准确率下降导致它在榜单上从第2名掉到第10名。

官方负责人Boris Cherny承认，模型默认开启“中等努力”模式，努力程度为85分。

官方解释称，这是为了平衡速度和成本，给用户更快的响应。

但重度用户认为，这种为省钱限制性能的做法是变相削减服务。

2月份，程序界面隐藏了思考过程，让用户觉得模型没有认真工作。

还有开发者发现，提示词缓存时长从1小时降到5分钟。

这导致长会话中缓存容易过期，额度消耗加快。

性能和计费的双重缩水，让处理复杂代码的程序员很失望。

不过，价格却上涨了。

企业包月套餐涨价

Anthropic调整计费规则，让企业用户措手不及，原本的包月模式被拆分。

现在的Claude Enterprise计费像流量计费——

用户除了20美元固定费用，还要按实际用量额外付费。

这对重度用户来说是个坏消息。

曾经每月200美元的公司，新规则下账单可能翻倍，甚至涨到三倍。

Anthropic调整计费是因为成本压力。

过去一年模型推理成本涨了三倍，管理层为保毛利率，从高频用户身上盈利。

甚至因为算力不足，限制用户调用OpenClaw等消耗资源的工具。

看到Anthropic的问题，OpenAI推出100美元的Codex订阅服务。

这可能是为了吸引不满涨价的用户。

Opus 4.7即将推出

爆料称，Anthropic最快本周推出Claude Opus 4.7。

这款新模型已准备好，将作为最新性能代表上线。

同时曝光的还有AI设计工具，用户可通过自然语言生成网页、演示文稿等。

该工具门槛低，懂不懂技术都能使用。

消息发布后，Adobe、Wix和Figma等公司股价下跌超2%。

这给市场带来了想象空间。

参考链接：

[1]https://venturebeat.com/technology/is-anthropic-nerfing-claude-users-increasingly-report-performance

[2]https://www.theinformation.com/articles/anthropic-changes-pricing-bill-firms-based-ai-use-amid-compute-crunch

[3]https://www.theinformation.com/briefings/exclusive-anthropic-preps-opus-4-7-model-ai-design-tool

本文来自微信公众号“量子位”，作者：克雷西，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

CRWV、NBIS单月股价翻倍成反弹先锋，AI新云春天是否真的来临？

快乐马出圈背后：阿里AI需优酷补内容生态短板

钛合金真空熔炼实时监控促提质增效原创技术驱动国产替代融资扩产

科氪 | 享刻智能：不逐人形机器人热潮，深耕餐饮场景做具身智能落地实践者

纪源资本12年7轮投资陪伴群核科技上市回报超70倍