OpenAI正在爆发一场全球AI安全热战，我们将如何应对？

06-25 18:01

近期 AI 一件重磅事件发生在该领域，引起了广泛关注。

北京时间 6 月 20 日，OpenAI 前首席科学家伊利亚创始人（Ilya Sutskever）宣布将在社交平台上创办一家“安全超级智能企业”（Safe Superintelligence Inc.，简称 SSI）。

" SSI 这是我们的使命，我们的名字，我们的整个产品路线图，因为这是我们唯一的焦点。我们的团队、投资者和商业模式都是实现的。 SSI 为目标。“伊利亚，科技企业家和投资者 Daniel Gross、OpenAI 前科学家 Daniel Levy “构建安全的超级智能，是我们这个时代最重要的技术问题，”该公司网站发布的联合签名文章称。在保证我们的安全始终处于领先地位的同时，我们计划尽早提高自己的能力。"

伊利亚透露，该公司已经启动了世界上第一个直接安全的超级智能实验室，只有一个目标和一个产品:一个安全的超级智能。但是现在，SSI 公司股东、科研团队和盈利模式尚未公布。

事实上，伊利亚离开 OpenAI，很大程度上是因为与与与与与与 OpenAI CEO 奥尔特曼（Sam Altman）对于核心管理层来说存在分歧，尤其是如何控制得很好。 AI、AGI在安全发展等问题上(通用人工智能)存在相反的观点。

奥尔特曼和在其中 OpenAI 总裁 Greg Brockman 为了获得更多的资金来支持加快商业化， AI 模型计算能力需求，力求快速增强 AI 力量；而伊利亚等人则希望 AI 更安全。

去年 11 月亮，双方矛盾激化，OpenAI 结果奥尔特曼和奥尔特曼上演了“宫斗”大戏 Greg Brockman 短暂离职后再回归 OpenAI，许多原股东大会的董事离开了，而伊利亚今年正在进行。 5 月亮宣布离职。

对此，国内 AI 瑞莱智慧安全公司（RealAI）CEO 田天钛媒体 AGI 等等，奥尔特曼和伊利亚的分歧在于对奥尔特曼和伊利亚的分歧 AI 伊利亚的新公司是为了安全的“路线之争”。 AI 设定安全目标。

田天指出，伊利亚和图灵获得者包括 Geoffrey Hinton 等人觉得，AI 现在安全问题已经到了“非常迫切”的程度。如果你现在不做，你很可能会错过这个机会。以后想弥补就没有概率了。

"大型模型领域也是如此。虽然我们对大模型有很高的期望，认为它可以应用于许多领域，但事实上，在严肃的场景中，真正应用大模型的经典案例仍然很少。主要问题是 AI 安全上。如果不处理安全可控的问题，对于一些严肃的情况，谁也不敢相信。 AI，没人敢用它（AI）。处理安全、可靠的问题只能说，AI 只有落地和应用才有可能。“田天说，如果一些商业公司对安全问题不够重视，没有任何界限快速前进，可能会造成一系列的安全危害，甚至可能对整个人类造成一些安全隐患和影响。

聊天机器人很早 ChatGPT 伊利亚在发布前就提到了。 AGI 对于人类社会可能的威胁。他把 AGI 与人类的关系相比，与人类和动物的关系相比，“人类喜欢许多动物，但当人类想要建造一条高速公路时，他们不会向动物寻求建议，因为高速公路对人们来说非常重要。通用人工智能与通用人工智能的关系也将如此，通用人工智能完全按照自己的意愿行事。"

AGI，也就是说，人工智能已经具备了与人类相同甚至超越人类的智能。简单来说就是能说会写，有计算、推理、分析、预测、实现目标等各种人类行为。这样的 AI 曾遥远，但现在 OpenAI 推出第四代模型 GPT-4 并且正在训练第五代模型 GPT-5 时，AGI 看起来就在眼前。

今年以来，AI 安全问题不断引起关注。

今年 1 月亮，一位受欢迎的美国歌手被使用。 AI 恶意生成虚假照片，在社交媒体上迅速传播，给歌星本人带来麻烦；2 月份，香港一家公司遭受" AI “换脸”诈骗，损失高达 2 据报道，该公司的一名员工在视频会议上被首席财务官要求转账。不过，大会上的这位“领导”和其他员工，其实都是深度伪造的。 AI 影像。诈骗者通过公开渠道获得的信息，合成了首席财务官的形象和声音，并制作了多人参加视频会议的虚假场景。

总的来说，为了实现 AGI 目标，目前，AI 在设计上，系统主要面临五大安全挑战：

软件和硬件的安全性:在软件和硬件方面，可能存在漏洞或侧门，包括应用程序、模型、平台和芯片。攻击者可以利用这些漏洞或侧门进行高级攻击。在 AI 从模型的角度来看，攻击者也可以在模型中植入侧门并进行高级攻击；因为 AI 模型无法解释，模型中植入的恶意侧门难以检测。

数据完整性：在数据方面，攻击者可在实践阶段添加恶意数据，影响数据。 AI 模型推理能力；攻击者还可以在判断阶段给要判断的样本添加少量噪声，故意改变判断结果。

模型保密:在模型参数方面，服务提供商通常只希望提供模型查询服务，而不是暴露培训模型；然而，通过多次查询，攻击者可以构建类似的模型，从而获得模型的相关信息。

模型鲁棒性:训练模型时的样品通常覆盖面不足，导致模型鲁棒性不强；当模型面对恶意样本时，无法给出正确的判断结果。

资料隐私：在客户提供培训资料的情况下，攻击者可以通过反复查询培训模型来获取用户的隐私资料。

张宏江在北京智源人工智能研究院学术顾问委员会主任 2024 北京智源大会表示，过去一年，大模型发展迅速，行业讨论了实现通用人工智能的路径和曙光，但 AI 安全问题的严重性和紧迫性不容忽视。

“当我们处于不同的水平 AI 能够审视安全问题，不仅要了解社会偏见、错误信息、隐性工作替代或大模型、自主机器人带来的大规模自动化造成的工作流失，还要关注隐性加速财富集中或财富两极分化等问题。 AI 新的经济体系和包含隐性破坏性风险或误用事故，甚至可能导致人类延展性风险。AI 有许多安全声明和请愿，但更重要的是明确目标，投入资源，付诸行动，共同应对风险。”张宏江说。

北京智源人工智能研究所董事长黄铁军表示，水深流急，AI 安全性已经进入风险非常突出的时期。应对 AI 安全性隐患，必须正确 AGI 水平和能力分为五个层次，而且，人类应该致力于解决问题。 AI 加强国际社会和国际社会的安全问题 AI 保证安全领域的合作， AI 技术可控，迎接安全 AGI 的来临。

AGI 五个等级的水平和能力

生成式 AI 技术是一把双刃剑，如何将生成式？ AI 强大的能力用来建立信息安全规范，把制约行业发展的“拦路虎”变成“压舱石”？业界一直在探索“技术治理技术”的解决方案。

就在 6 月 21 日本，瑞莱智慧推出了世界上第一个实时监控。 AI 产生内容产品 RealBelieve，中文名“尊嘟假嘟”。

据报道，以前是国内外的 AIGC 检验产品被动上传检验不同，RealBelieve 主要面向终端用户，可以提供主动实时监控和保护，可以访问视频流来识别人脸的真伪，也可以在用户浏览网页内容时提供。 AIGC 产生概率提醒。不仅可以为终端用户提供各种模式的文本、照片、视频和音频的文件上传测试服务，还可以通过浏览器插件即时提示用户浏览网页的疑似 AI 产生内容，变被动为主动。现在，尊嘟假嘟 RealBelieve 内测征募已经开始。

田天说，作为我国为数不多的专攻专业 AI 在安全领域，瑞莱智慧在政务、金融等领域服务了100多名客户。伴随着 AI 技术的发展，整体安全 AI 发展的优先事项一直在前进。未来 AI 技术要向超级智能方向发展，必须建立整个安全系统，以确保超级智能技术的形成。

”“假如现在没有做好 AI 如果安全的话，也许我们以后就没有机会了。”田天说。

(本文首发于钛媒体 App，作者｜编辑林志佳｜胡润峰）

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读