Claude性能下滑价格上涨,Opus跌落神坛
发现这一问题的是AMD高级总监Stella Laurenzo。
她分析了近7000份会话日志后指出,现在的Claude处理复杂任务时表现不佳。

第三方跑分数据也证实了这一点,原本排名前2的Claude,几周内就跌到了第10位。
用户们支付同样的订阅费,却使用着性能下降的模型,感觉自己被欺骗了。
Claude性能下降被发现
Stella对Claude Code的运行数据进行了详细检查。
她分析了6852份会话文件、17871个思考块和超过23万次工具调用。

结果显示,从2月份开始,模型的推理能力大幅下降。
在处理复杂工程任务时,它不再可靠,经常出现逻辑问题或无法理解复杂指令。
原本认真解决问题的助手变得敷衍,用简单方法应付,甚至中途停止任务。
第三方基准测试BridgeBench中,Opus 4.6的准确率从83.3%降到68.3%。
准确率下降导致它在榜单上从第2名掉到第10名。

官方负责人Boris Cherny承认,模型默认开启“中等努力”模式,努力程度为85分。
官方解释称,这是为了平衡速度和成本,给用户更快的响应。

但重度用户认为,这种为省钱限制性能的做法是变相削减服务。
2月份,程序界面隐藏了思考过程,让用户觉得模型没有认真工作。
还有开发者发现,提示词缓存时长从1小时降到5分钟。
这导致长会话中缓存容易过期,额度消耗加快。
性能和计费的双重缩水,让处理复杂代码的程序员很失望。
不过,价格却上涨了。
企业包月套餐涨价
Anthropic调整计费规则,让企业用户措手不及,原本的包月模式被拆分。
现在的Claude Enterprise计费像流量计费——
用户除了20美元固定费用,还要按实际用量额外付费。
这对重度用户来说是个坏消息。
曾经每月200美元的公司,新规则下账单可能翻倍,甚至涨到三倍。
Anthropic调整计费是因为成本压力。

过去一年模型推理成本涨了三倍,管理层为保毛利率,从高频用户身上盈利。
甚至因为算力不足,限制用户调用OpenClaw等消耗资源的工具。
看到Anthropic的问题,OpenAI推出100美元的Codex订阅服务。
这可能是为了吸引不满涨价的用户。
Opus 4.7即将推出
爆料称,Anthropic最快本周推出Claude Opus 4.7。
这款新模型已准备好,将作为最新性能代表上线。
同时曝光的还有AI设计工具,用户可通过自然语言生成网页、演示文稿等。
该工具门槛低,懂不懂技术都能使用。
消息发布后,Adobe、Wix和Figma等公司股价下跌超2%。
这给市场带来了想象空间。
参考链接:
[1]https://venturebeat.com/technology/is-anthropic-nerfing-claude-users-increasingly-report-performance
[2]https://www.theinformation.com/articles/anthropic-changes-pricing-bill-firms-based-ai-use-amid-compute-crunch
[3]https://www.theinformation.com/briefings/exclusive-anthropic-preps-opus-4-7-model-ai-design-tool
本文来自微信公众号“量子位”,作者:克雷西,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com






