Anthropic超强新模型意外泄露:性能超越Opus,安全隐患引担忧

2分钟前

本文来自微信公众号:夕小瑶科技说,作者:未知艺术家



近日,《财富》杂志爆料,Anthropic因内容管理系统(CMS)配置失误,近3000个未发布资产(含草稿博客)被存放在可公开搜索的数据缓存中,意外泄露了尚未发布的新模型信息。



很快,Anthropic的Dario Amodei承认了该新模型的存在。



泄露的博客显示,这一新模型全面超越Opus 4.6,是Anthropic迄今开发的最强大AI模型。



Anthropic发言人称,它代表AI性能的一次重大跃迁。



目前,Anthropic已关闭公众搜索和获取这些内容的权限,好在有技术爱好者及时保存了草稿。



https://m1astra-mythos.pages.dev






草稿博客详细描述了新模型,有Mythos和Capybara两个名称,内容完全一致。







Anthropic是故意泄露还是操作失误?



Anthropic的重磅新模型尚未正式发布就意外泄露,事件起因颇具戏剧性。



官方回应《财富》杂志称,这是一次人为操作失误。他们使用的第三方CMS工具,上传文件默认公开,需手动设为私密,有人忘记修改,导致近3000个内部资产(含新模型草稿)公开。



《财富》杂志浏览这批文件时发现了这一重要信息。



此次泄露或非有意炒作,因为同批泄露的还有员工育儿假文件、Dario Amodei将出席的欧洲CEO闭门峰会详情等内部信息。



网友对两个名称的猜测较多,主流观点认为Claude Mythos是新模型名,Capybara是内部代号,下文暂称其为Mythos。





性能实现极致提升



泄露草稿显示,Mythos是全新模型层级:比Opus 4.6更大、更强,运行成本和订阅价格更高,在软件编程、学术推理、网络安全等测试中分数显著提升,是Anthropic最强大的AI模型。



Anthropic现有模型分三档:Haiku(最小最快)、Sonnet(中间档)、Opus(最大最强),Mythos将成为Opus之上的第四档。



目前Mythos已完成训练,仅少数早期客户内测,暂未对公众开放。



安全隐患引发关注



Mythos训练完成却未公开,原因之一是其强大程度让Anthropic也心生顾虑。



泄露草稿提到,该系统网络能力远超其他AI模型,能以防御者难以应对的方式利用漏洞,若被黑客获取,可能发动大规模自动化网络攻击。



Anthropic表示会谨慎对待,全面评估风险,包括短期网络安全领域的真实威胁。毕竟Opus 4.6已能发现生产代码库中未被发现的漏洞,若AI攻击能力超过防御能力,网络安全将面临更大风险。



Anthropic的发布策略是先向网络安全防御机构开放早期访问,让其用该模型加固代码库,提前封堵漏洞。这意味着公众与Mythos正式见面的时间将推迟。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com