AI模型打破阴谋论，登上Science封面，用聊天戳破谣言漏洞。

2024-09-19

智东西9月15日报道称，AI聊天机器人在打破阴谋论方面取得了重大突破，可以有效削弱部分信徒对阴谋论的信心水平。该论文于9月13日在国际顶级学术期刊Science封面上发表。

许多人对阴谋论深信不疑，导致一些荒谬的谣言层出不穷。麻省理工学院研究小组发现，GPT-4 在对话中，Turbo模型可以通过量身定制的证据列表和个性化的深度聊天，将一些阴谋论家对阴谋论的平均信任度降低20%，效果至少持续了2个月。这种干涉反映了负责任的安排生成AI有利于辟谣和缓解矛盾。

题目为《通过与AI对话持续减少相信阴谋论》。（Durably reducing conspiracy beliefs through dialogues with AI）》。

论文链接：https://www.science.org/doi/10.1126/science.adq1814

充分有力的证据能说服大家放弃阴谋论吗？

阴谋论数不胜数，有时甚至会产生危险的后果，无论是关于月球登陆从未发生过的错误观点，还是关于新冠肺炎疫苗中含有微芯片的虚假说法。对未经证实的阴谋论的信任是公众关注的重要问题，也是学术研究的焦点。

虽然这些阴谋论通常很不可信，但很多人还是选择相信。著名的心理学理论认为，很多人想选择阴谋论来满足隐藏的心理“需求”或动机，所以很难被事实和反证据说服，放弃这些毫无根据的阴谋论。这篇论文对这种传统观点提出了异议。有没有可能用足够有力的证据说服大家走出阴谋论？ “无底洞”。

“传统观点会告诉你，即使是根据证据，相信阴谋论的人也很少改变自己的想法。”托马斯·科斯特洛（Thomas H. Costello）然而，这项新研究提供了不同的观点。“我们的研究成果从根本上挑战了这一观点:一旦我们陷入了相信阴谋论的无底洞，证据和论点基本上是没有用的。”研究小组写道。

由于缺乏足够的深度和个性化，研究假设基于事实性和纠正性信息的论据可能无效。为了验证这一假设，研究人员使用了大语言模型的进步，这是一种可以获取大量信息并生成定制论据的AI。因此，大语言模型可以产生具有批判性思维的对话，直接反驳每个人引用的具体证据来支持他们相信阴谋论。

在两次实验中，2190名参与者用自己的话来讨论他们相信的阴谋论和他们认为支持这一理论的证据。这些信息被输入到AI系统。参与者还被要求以100分的标准来评估他们相信的阴谋论的真实程度。

随后，他们与GPT-4大语言模型在大家的提示下，Turbo进行了三轮对话，GPT-4Turbo回应了这些具体证据，并试图降低参与者对阴谋论的信任。或者作为对比条件，与AI无关的话题进行对话。对话结束后，再次评估参与者认为阴谋论的真实性。

研究结果表明，与AI讨论阴谋论的参与者对所选阴谋论的平均信任度降低了20%。这种效果至少持续了2个月，一点也没有减少。然而，那些讨论非阴谋论话题的人对真实性的评分只是略有下降。

研究小组表示，这种效果可以在各种阴谋论中持续观察到，包括与COVID-19、2020年美国总统大选等热点事件相关的经典阴谋论，如刺杀肯尼迪、外星人和光明会。值得注意的是，AI并没有降低参与者对真正阴谋论的信任。

研究人员补充说，效果的大小取决于各种因素，包括阴谋论对参与者的重要性和对AI的信任。

科斯特洛说：“大约四分之一的参与者在实验开始时相信阴谋论，但在结束后不再相信。

AI只能在许多情况下逐渐减弱——使人们更加怀疑和不确定——但是少数人完全摆脱了他们的阴谋论信任。

研究人员补充说，减少参与者对阴谋论的认可也可以在一定程度上减少他对其他阴谋论的认可。阴谋论的世界观普遍下降，反驳其他阴谋论者的意图也增加了。这种方法可能在现实世界中得到应用——例如，AI可以在社交媒体上回复与阴谋论相关的帖子。

另外，一位专业人士对AI提出的128个样本进行了评估，其中99.2%是正确的，0.8%是误导性的，没有任何虚假。

研究表明，阴谋论的“无底洞”可能确实有出口。心理需求和动机本质上并不会导致阴谋论者对证据视而不见——他们只需要正确的证据。事实上，通过展示大语言模型的说服力，这项研究不仅强调了生成式AI在负责任地使用时可能产生的积极影响，而且强调了尽量减少不负责任地使用这项技术的迫切性。

没有参加这份工作的剑桥大学教授桑德尔·范·德林登（Sander van der Linden）质疑现实世界中每个人是否会自愿与这种AI互动。

他还说，目前还不清楚参与者和匿名人类聊天是否会得到类似的结果，也有关于如何说服AI中的阴谋论者的问题，因为这个系统还采用了同情和肯定等策略。

然而，他补充道:“总的来说，这是一个非常新颖和重要的发现，也是AI如何用来打击错误信息的一个很好的例子。”

本文来自微信微信官方账号的“智东西”（ID：zhidxcom），作者：吴浪娜，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com