Anthropic超强新模型意外泄露：性能超越Opus，安全隐患引担忧

03-28 06:39

本文来自微信公众号：夕小瑶科技说，作者：未知艺术家

近日，《财富》杂志爆料，Anthropic因内容管理系统（CMS）配置失误，近3000个未发布资产（含草稿博客）被存放在可公开搜索的数据缓存中，意外泄露了尚未发布的新模型信息。

很快，Anthropic的Dario Amodei承认了该新模型的存在。

泄露的博客显示，这一新模型全面超越Opus 4.6，是Anthropic迄今开发的最强大AI模型。

Anthropic发言人称，它代表AI性能的一次重大跃迁。

目前，Anthropic已关闭公众搜索和获取这些内容的权限，好在有技术爱好者及时保存了草稿。

https://m1astra-mythos.pages.dev

草稿博客详细描述了新模型，有Mythos和Capybara两个名称，内容完全一致。

Anthropic是故意泄露还是操作失误？

Anthropic的重磅新模型尚未正式发布就意外泄露，事件起因颇具戏剧性。

官方回应《财富》杂志称，这是一次人为操作失误。他们使用的第三方CMS工具，上传文件默认公开，需手动设为私密，有人忘记修改，导致近3000个内部资产（含新模型草稿）公开。

《财富》杂志浏览这批文件时发现了这一重要信息。

此次泄露或非有意炒作，因为同批泄露的还有员工育儿假文件、Dario Amodei将出席的欧洲CEO闭门峰会详情等内部信息。

网友对两个名称的猜测较多，主流观点认为Claude Mythos是新模型名，Capybara是内部代号，下文暂称其为Mythos。

泄露草稿显示，Mythos是全新模型层级：比Opus 4.6更大、更强，运行成本和订阅价格更高，在软件编程、学术推理、网络安全等测试中分数显著提升，是Anthropic最强大的AI模型。

Anthropic现有模型分三档：Haiku（最小最快）、Sonnet（中间档）、Opus（最大最强），Mythos将成为Opus之上的第四档。

目前Mythos已完成训练，仅少数早期客户内测，暂未对公众开放。

Mythos训练完成却未公开，原因之一是其强大程度让Anthropic也心生顾虑。

泄露草稿提到，该系统网络能力远超其他AI模型，能以防御者难以应对的方式利用漏洞，若被黑客获取，可能发动大规模自动化网络攻击。

Anthropic表示会谨慎对待，全面评估风险，包括短期网络安全领域的真实威胁。毕竟Opus 4.6已能发现生产代码库中未被发现的漏洞，若AI攻击能力超过防御能力，网络安全将面临更大风险。

Anthropic的发布策略是先向网络安全防御机构开放早期访问，让其用该模型加固代码库，提前封堵漏洞。这意味着公众与Mythos正式见面的时间将推迟。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com