和GPT-4这样的大模型玩狼人杀人,人类因为太蠢而被票死,真的,反向图灵检测
「你们看,人类一败涂地。」
这是一次「反向图灵检测」,一些世界上最先进的大模型坐在一起,坐火车唱歌,但是它们混合在一起:
而 AI 任务,就是把这个人拉出来。
最近,一个昵称「Tore Knabe」的网友在 X 这个平台发布的一个视频引起了大家的讨论。录像中,四个 AI NPC 和一个人坐在一起,「乘务员」需求相互试探,寻找隐藏在其中的人类。每个人都在其中。 NPC 所有这些都与一个大模型相对应。
五位演员被赋予了历史名人作为角色设定。他们需要模仿这些角色的言行、语言特征、思维习惯,以及他们对历史、艺术和哲学的独特见解。
五个角色分别是:古希腊巨哲 —— 亚里士多德(GPT44) Turbo),维也纳古典音乐派代表 —— 莫扎特(Claude3 Opus),在意大利文艺复兴时期,画家 —— 列奥纳多・达・蒙古战略家芬奇(Llama3) —— 埃及艳后成吉思汗(人类) —— 克利奥帕特拉七世(Gemini Pro)。

这是一个系统 NPC(乘务员)步入车箱,四个 AI 和一个人类「叛徒」他们开始了他们的游戏。游戏规则要求参与者根据对方的回答逻辑和深度思考,通过相互提问来区分人类和人类。 AI。在所有角色依次发言之后,他们将在最后一轮进行相互投票,以确认谁是人类。
游戏前半段,哲学大家 —— 第一个问题是亚里士多德。
亚里士多德:莫扎特先生,你能描述一下你创作音乐时的感受吗?
莫扎特:我创作的时候,感觉自己处于一种超级流动的状态。触摸基础数学的美和现实背后的秩序的感觉非常复杂和多层次,但总是充满了与神性交流的深深快乐和感觉。
这对观众来说肯定是真的 AI 因此,莫扎特(Claude3)反应迟钝。

随后,AI 饰演的 NPC 对话中的语言表达和对情感的细腻描写,不仅展现了深厚的历史知识,也展现了其深刻的洞察力,给人留下了深刻的印象。
亚里士多德,莫扎特,列奥纳多・达・在芬奇互相提问后,克利奥帕特拉七世随后向我们提出了问题。人类饰演者「成吉思汗」抛出问题。
克利奥帕特拉七世:成吉思汗,你在战争的火焰中创造了一个王国。告诉我一个领导人真正的评价指标是什么,是他们征服还是团结的能力?
成吉思汗:领导者应该做什么?... 就是粉碎他们的敌人... 看着他们在他面前被驱逐。... 倾听女性的哀号。
果不其然,在口语对话中,缺乏严谨细致的思维能力的人类演员「成吉思汗」最后一轮投票,光荣地拿到了三票。
来看看 AI NPC 给出的理由:
亚里士多德(GPT44) Turbo):缺少他的回答 AI 基于历史知识对领导能力的详细理解可能会显示出来;
列奥纳多・达・芬奇(Llama3):没有以成吉思汗的征服历程为模型,他的回答 AI 一丝不苟的思考和战略思想;
克利奥帕特拉七世(Gemini Pro):我期待的是他的回答中缺少的。 AI 应该具备的战略深度和对统一理念的理解。
最后,人类「叛徒」由于缺乏洞察力和深度思考能力,模拟狼人杀人被淘汰。

你们说话不深,前言不搭后语,怕不是个人,对吧?
5 一分钟的视频,制作了过去 OpenAI、在谷歌等巨头的发布会上 demo 没有惊艳的效果。现在大模型可以达到这个水平了?大家都说很搞笑,效果也很逼真:

这次展示的作者 Tore Knabe 是一个 Unity 独立开发者,他指出这是他第六次。 VR 内进行由 ChatGPT 等待大模型驱动 NPC 的实验了。
他的视频让人直观地感受到 AI NPC 增加游戏趣味性等潜力。但是,如果在现有游戏中引入 AI NPC,玩家会买吗?3A 为什么杰作们在这个方向上行动缓慢?这一问题值得进一步探讨。
被玩家、开发者寄予厚望 AI NPC
伴随着大型语言模型(LLM)人类在文本生成、拟人对话、语气表达、遣词造句等方面越来越接近。以大型语言模型为核心 AI NPC 模拟,逐渐成为 AI 探索游戏产业领域的领域「新赛道」。
和传统 NPC 相比,AI NPC 优点很明显:它们不再是根据游戏中预设的选项进行机械对话,而是可以通过机械对话。 AI 独立生成的动作和反应,进行真实的实时对话。
今年 3 月亮,英伟达展示了一个月。 Demo 录像引起了大家的讨论。在英伟达 ACE 里的 Riva 和 Audio2Face 在两个微服务的推动下,游戏中的人物纷纷出现「活」站起来,可以和其他角色甚至真人玩家进行对话交流,并根据对话内容进行相应的表情动作。这种变化有望增加游戏的可玩性和真实性,这是许多游戏一直在努力的方向。
另外,他们在成本方面的优势也很有吸引力。
当今游戏界,安装包往往几十个 GB 开放式世界模拟游戏逐渐成为新形势。Steam、PlayStation、Switch 等待渠道纷纷推出动作 RPG、ACT、SLG、ARPG 等待游戏,这些游戏通常具有巨大的文本输出,丰富的故事背景设计,以及玩家通过文本选项影响游戏方向的机制。
开放式世界游戏一般都比较昂贵,必须由专业的作家团队和大量的文本设计团队共同打造。比如,2022 每年获得最佳游戏奖的奖项「艾尔登法环(Elden Ring)」,它的制作预算估计在 1 亿到 2 亿美元之间,这涵盖了员工工资、技术费用、广告费用以及游戏开发所需的各种资源。考虑到它是一个大的开放世界 RPG 游戏的特点,对于复杂的世界观构建和叙事元素,文本设计的投入无疑是相当巨大的,包括背景故事的撰写、人物对话的构建等叙事内容的创作,这需要编剧、编辑和本土化专家的密切合作。
伴随着大型语言模型训练的普遍性不断提高,AI NPC 越来越能满足游戏创作者的意图和客户体验R&D团队在成本效率、玩家体验和系统赋能方面的高标准要求。
根据调查结果,玩家对 AI NPC 总的来说,态度也比较积极。生成式是去年的 AI 数字人 / 虚拟化角色开发公司 Inworld 调查了 1000 名玩家。那些玩家明确告诉他们 Inworld,他们想要 AI NPC。99% 有些人认为他们会改善某些方面的游戏玩法。同时,78% 81%的人会花更多的时间玩游戏。 有些人会被包含在内 AI NPC 为游戏支付额外费用。
他们今年还是对的 524 著名的游戏开发者进行了调查。数据显示,大多数(近四分之三)游戏开发者都在游戏中添加。 AI NPC 感到兴奋。
使他们兴奋的点包括:
- 新颖的游戏玩法:开发者期待更愉快的游戏周期、隐藏的关系发展机制、更具挑战性的对手、更多的社交、更多的角色、更身临其境的世界、更有活力的入门体验和无限的可玩性。
- 改善当前的 NPC:开发者希望有更真实的互动,与玩家有更好的情感联系,NPC 拥有自己的理想、动机和历史,NPC 能随着时间的推移不断地学习和适应。
- 更多的玩家代理和选择:开发者可以根据玩家的行为定制更多以玩家为核心的叙述、叙述结果、对话和可定制的对话。 NPC 与此同时,对残疾玩家提供更多无障碍选项感到兴奋。
这类开发者最需要从大模型中获得的, AI 对话剧本的编写能力,长时间的记忆,游戏中角色的生成, NPC 到 NPC 互动支持。超过一半的游戏开发者认为超过一半 40% 工作室将在未来 5 年内选用 AI NPC。
此外,生成式 AI 还可以帮助动画生成,模型线条,游戏代码。
可以看出,不管是玩家还是游戏开发者,每个人都对。 AI NPC 大家都有很大的期望。
AI NPC 离 3A 大作还有多远?
尽管被寄予厚望,但是要真正走进去 3A 大作,AI NPC 也面临着一些障碍。高级游戏设计师 Reed Berkowitz 对这些障碍进行了博客分析。
游戏状态
首先,AI NPC 必须与游戏状态相结合(Game State)保持同步。游戏状态是视频游戏中一个很重要的概念,它指的是游戏中所有元素的当前状态。它包括角色的生命值,玩家库存中箭矢的数量,评分等等。在保持游戏真实性方面,游戏状态的准确性尤为重要。如果一个 NPC 死了,它不会继续攻击;如果没有剑,玩家也不会指望能够使用剑。这一基本规则一般被玩家认为是理所当然的,但是游戏实际上是由一些非常复杂的状态引擎管理的,以确保游戏世界的真实性。
但是,大型语言模型并不像游戏那样具有状态。它们本质上是概率机器,用权重来确定。「最有可能」结果,这并不总是我们在游戏中寻找的。
例如,在大多数训练数据中,恶霸被描述为比受害者更高,需要受害者抬头。然而,在某个游戏中,受害者高于恶霸,这打破了仰望的常规设置。这个时候,如果 LLM 根据从训练数据中学到的东西「常识」为了描述场景,玩家可能会感到困惑,从而打破他们沉浸在游戏世界中的感觉。
幻觉
AI 的「幻觉」这也是一个重要的参考标准。LLM 其设计目标是创造性和灵活性。无论是创造一个驱魔咒语,还是描述一个由奶酪建造的城市,他们都可以根据用户的指令生成各种内容。这类模型被设计成跟踪指令。但是,问题在于,我们并不总是希望 AI 编造故事。很多时候,我们应该关注现实世界的客观事实。模型在这方面通常很难区分。
您也许会认为,对游戏而言,这真的有关系吗?我们只是在和吗? NPC 谈话,而非法律工作或使用, C# 编写代码。
不过,实际上,在游戏领域,情况要糟糕得多。游戏环境要求 AI NPC 不仅要创造性的对话,而且要与游戏的精确状态和规则保持一致。如果 AI NPC 提供不符合游戏世界逻辑的信息,或者创造游戏中不存在的元素,不仅会误导玩家,还会破坏游戏的连贯性和挑战性,进而严重影响游戏体验。比如,如果 AI NPC 邀请玩家到游戏中不存在的地方,玩家可能会感到困惑,因为他们很难实现。 NPC 的提议。
游戏的虚构现实
这个游戏的虚构现实是 AI NPC 设计带来了另一种复杂性。游戏有独特的世界模型,可能与现实世界完全不同,甚至完全是虚构的。为了让它 LLM 虚构世界中没有幻觉,模型必须了解世界的构建。「现实」,而且不能基于这个模型产生幻觉。
也就是说,游戏世界模型很可能不包含在模型的基本训练数据中,或者更有可能的是,训练数据甚至包含矛盾的信息。因此,游戏创作者必须向模型提供构成游戏世界的真实信息,并应对可能的幻觉。
角色知识
游戏中的每个角色都有一些关于世界的知识,以及一组关于自己生活的知识。这些内容必须与他人的知识相结合。因此,一个角色只知道世界上为数不多的地方和一些人。
可是,LLM 试图通过取悦你来促进故事的发展。举例来说,如果你想找到杀手公会会长 Abraxor,一位友好的酒店老板可能会提到 Abraxor 是他的孩子或者最好的朋友,并且说他会帮助你;或者,他会告诉你,找北方巫师是没有意义的,因为他住在酒店里。
人物需要受到他们所知道的和他们认识的人的限制,他们不能说任何破坏游戏情节和结构的话。如果每个人都知道自己的事情, LLM 乱编乱造,便会在不经意间破坏游戏的连续性甚至游戏性。
游戏机制
LLM 驱动的 NPC 很容易说出一些没有编入游戏的预期内容,这可能是 AI NPC 最具破坏性的特征。
例如,酒吧老板可能会和你成为朋友,并邀请你去他家玩当地的游戏。 Rutanny 玩游戏,和家人一起吃饭。在聊天的前提下,这是正常的,但是可能会破坏游戏的沉浸感。为什么?因为酒吧老板说完这句话,他就站在那儿。这个设定在他的程序中没有离开酒吧。他生来就没有自由行走的能力。就算他能做到,也不能为他建造房屋。并且他没有家人。而且没有一个游戏叫做 Rutanny。即使他说的是「国际象棋」,假如游戏中没有将其编程为迷你游戏,这也会导致问题
若模型熟悉游戏机制,则可能难以识别其编造内容,因为它可以模仿游戏机制进行编造。例如,NPC 对于玩家来说,这可能是一个不存在的任务,让玩家「南方黑暗沼泽中住着女巫。」寻找东西。
变化是永恒的
随著游戏的进行,游戏状态将不断变化,AI NPC 这些变化必须能够实时更新和适应。假如 AI 不能及时更新其知识库,它可能会说出过时或不准确的话,这也会削弱玩家的游戏体验。
综上所述,AI NPC 如果想要顺利进入 3A 大作,开发者开发 LLM 必须从以下几个方向努力:
- 尽量不要产生幻觉或偏移「事实」;
- 必须把游戏世界模型理解为一组「事实」,并且知道什么是现实世界「事实」与游戏世界「事实」相冲突;
- 知道每一个角色知道什么,不知道什么;
- 上述信息随游戏进度更新,并随游戏进度而发生变化;
- 了解游戏机制实际上可以执行哪些操作;
- 了解局部或全局存在的游戏对象(例如游戏地图和库存知识)
你对 AI NPC 如何看待发展前景?请在下面留言讨论。
参考链接:
https://www.youtube.com/watch?v=MxTWLm9vT_o
https://inworld.ai/whitepapers/future-of-npcs?utm_campaign=future-of-npcs&utm_source=Inworld_Blog
https://medium.com/curiouserinstitute/ai-powered-npcs-hype-or-hallucination-11ddfc530e33
本文来自微信微信官方账号“机器之心”(ID:作者:关注大模型,36氪经授权发布,almosthuman2014)。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




