Claude性能下滑价格上涨,Opus跌落神坛

1分钟前
Claude性能下降,已成为重度用户热议的话题。


发现这一问题的是AMD高级总监Stella Laurenzo。


她分析了近7000份会话日志后指出,现在的Claude处理复杂任务时表现不佳。



第三方跑分数据也证实了这一点,原本排名前2的Claude,几周内就跌到了第10位。


用户们支付同样的订阅费,却使用着性能下降的模型,感觉自己被欺骗了。


Claude性能下降被发现


Stella对Claude Code的运行数据进行了详细检查。


她分析了6852份会话文件、17871个思考块和超过23万次工具调用。



结果显示,从2月份开始,模型的推理能力大幅下降。


在处理复杂工程任务时,它不再可靠,经常出现逻辑问题或无法理解复杂指令。


原本认真解决问题的助手变得敷衍,用简单方法应付,甚至中途停止任务。


第三方基准测试BridgeBench中,Opus 4.6的准确率从83.3%降到68.3%。


准确率下降导致它在榜单上从第2名掉到第10名。



官方负责人Boris Cherny承认,模型默认开启“中等努力”模式,努力程度为85分。


官方解释称,这是为了平衡速度和成本,给用户更快的响应。



但重度用户认为,这种为省钱限制性能的做法是变相削减服务。


2月份,程序界面隐藏了思考过程,让用户觉得模型没有认真工作。


还有开发者发现,提示词缓存时长从1小时降到5分钟。


这导致长会话中缓存容易过期,额度消耗加快。


性能和计费的双重缩水,让处理复杂代码的程序员很失望。


不过,价格却上涨了。


企业包月套餐涨价


Anthropic调整计费规则,让企业用户措手不及,原本的包月模式被拆分。


现在的Claude Enterprise计费像流量计费——


用户除了20美元固定费用,还要按实际用量额外付费。


这对重度用户来说是个坏消息。


曾经每月200美元的公司,新规则下账单可能翻倍,甚至涨到三倍。


Anthropic调整计费是因为成本压力。



过去一年模型推理成本涨了三倍,管理层为保毛利率,从高频用户身上盈利。


甚至因为算力不足,限制用户调用OpenClaw等消耗资源的工具。


看到Anthropic的问题,OpenAI推出100美元的Codex订阅服务。


这可能是为了吸引不满涨价的用户。


Opus 4.7即将推出


爆料称,Anthropic最快本周推出Claude Opus 4.7。


这款新模型已准备好,将作为最新性能代表上线。


同时曝光的还有AI设计工具,用户可通过自然语言生成网页、演示文稿等。


该工具门槛低,懂不懂技术都能使用。


消息发布后,Adobe、Wix和Figma等公司股价下跌超2%。


这给市场带来了想象空间。


参考链接:


[1]https://venturebeat.com/technology/is-anthropic-nerfing-claude-users-increasingly-report-performance


[2]https://www.theinformation.com/articles/anthropic-changes-pricing-bill-firms-based-ai-use-amid-compute-crunch


[3]https://www.theinformation.com/briefings/exclusive-anthropic-preps-opus-4-7-model-ai-design-tool


本文来自微信公众号“量子位”,作者:克雷西,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com