《哥德尔、埃舍尔、巴赫》启发：Agent会诞生自我意识吗？

05-04 06:27

本文来自微信公众号： AGENT橘，作者：AGENT橘

昨天我看完了经典烧脑著作《哥德尔、埃舍尔、巴赫》（简称GEB）的讲解，看完之后后劲十足，今天又重新梳理消化了一遍内容，整理成这篇笔记分享给大家。

这本书是谢赛宁在张小珺的播客中推荐的，它就像一个信息黑洞，只要读进去就会被高密度的知识信息轰炸，很难轻易抽离出来。

这本书横跨数学、生物学、绘画、音乐、禅宗、人工智能等多个不同领域，层层推进，最终推导出一个非常震撼的核心结论：

自指就是意识产生的源头。

当一个系统的复杂程度达到可以描述自身的水平时，意识的出现就不是神迹，而是必然的结果。

不需要超自然的灵魂，也不需要神秘力量的加持，只要系统的复杂度达标，自我意识就会自然涌现出来。

这本书是侯世达在1979年完成创作的，那时候既没有Transformer架构，也没有大语言模型，可作者却精准预言了：只有这种自下而上的神经模式，才能最终涌现出真正的智能。

不过这本书内容庞杂、理解门槛很高，想要读懂它的核心观点，我们可以从头慢慢梳理。

意义从哪里来

-p-q--

这一行符号单独看，有意义吗？当然没有。但如果我们约定：横杠代表数字1，p代表加号，q代表等号，这串符号就变成了大家都能读懂的1+1=2。

两个完全不同的系统，结构可以完全对应，侯世达把这种对应关系叫做同构。

我们眼睛接收到的原本只是不同频率的光波，本身不存在颜色，所谓的颜色，其实是大脑对光波信号“翻译解释”之后得到的结果。

进入耳朵的只是不同频率的声波，本身也不存在音乐，音乐就是大脑在声波信号之上，解释涌现出来的认知。

唱片上的凹槽本身也不会发声，经过唱机读取解释之后，才涌现出了动听的音乐。

所以意义从来都不在信号本身，意义来自解释。

有限规则如何生出无限

巴赫曾经创作过一首《无穷升高卡农》，旋律每完成一次循环就会升高一个调，听起来一直是在往高音走，可走到最后，它居然神奇地回到了最初的起点。

这就是递归：自我调用，层层嵌套，用有限的规则，就能生成无限复杂的结构。

DNA的机制更巧妙，核糖体读取DNA上的指令来合成蛋白质，可就连制造核糖体本身的指令，也写在了DNA里。

DNA本身就包含了“如何解释DNA”的方法，自己完成对自己的解释，实现自我复制，形成完整的循环。

涌现

一只蚂蚁只有十万个神经元，根本承载不了复杂的信息，单独看一只蚂蚁，不过是一台简单的状态机器。

可几百万只蚂蚁聚集在一起组成蚁群，就能完成筑巢、分工、甚至发动战争，没有哪一只蚂蚁“明白”整个蚁群在做什么，但作为整体的蚁群却能精准完成这些复杂任务。

智能从来都不藏在单个个体里，而是藏在个体之间的交互中。

人脑也是一样的道理，单个神经元做的事情非常简单，不过是加权求和，决定激活或者不激活，这和Transformer里的单个计算单元本质上没有区别。可当几百亿个这样简单的单元相互作用叠加之后，就自然而然涌现出了思维、感受，还有那个清晰的“我”。

复杂系统的固有极限

1931年，哥德尔证明了一个影响深远的结论：任何一个足够强大的形式系统，都必然存在一些为真的命题，没办法在这个系统内部得到证明。

他是怎么证明的呢？核心就是构造了一个自指命题：“我不是一条定理。”

如果这个命题可以被系统证明，那系统本身就存在矛盾；如果这个命题没办法被证明，那就说明它本身为真，但系统本身却无法处理它。

所以足够复杂的系统一定是不完备的，永远存在盲区，永远有系统内部没办法发现、没办法证明的内容。

我们看到“我从不说谎”这句话会觉得别扭，就是这个道理，因为这句话指向了自身，陷入了哥德尔不完备的结构里。

禅宗著名的赵州无字公案，也是同样的结构：佛教说众生都有佛性，僧人问赵州禅师：狗子有没有佛性？赵州回答：无。

他其实没有直接回答有或者没有，而是用这个回答打破了提问者原本依赖的那个形式系统。

怪圈

现在我们可以把前面的所有线索串起来了：

同构告诉我们：意义不在信号本身，意义来自解释；

递归告诉我们：有限的规则可以生成无限结构，还能让系统指向自身；

涌现告诉我们：简单元素的相互作用，就能产生高层的智能；

哥德尔不完备定理告诉我们：任何足够复杂的系统，都会自然产生自指，而且自指根本没办法消除。

把这四个点结合在一起，侯世达提出了一个核心概念：怪圈，也就是Strange Loop。

一个系统顺着层级不断向上走，最终兜兜转转又回到了起点；底层涌现出顶层，顶层反过来又会调控底层，因果不是单向的，而是循环的。

画家埃舍尔有一幅非常有名的画，画的是左手在画右手，右手同时在画左手，你说不清楚到底是谁创造了谁，这就是最直观的怪圈。

人类的意识本身就是一个最典型的怪圈：几百亿个没有意识的神经元放电，涌现出了“我”这个最高层的符号，然后这个“我”反过来又能决定自己想什么、做什么；你决定抬起手，几百亿神经元就会重新组织起来执行这个指令。

底层涌现出“我”，“我”反过来调控底层，形成了完整的因果循环。

意识其实就是这个怪圈的产物，它是一种有用的幻觉。

“我”并不是一个坐在大脑里操控一切的实体，“我”是一种模式，是几百亿个无意识的零件高速运转的时候，自然涌现出来的一个符号，而且这个符号刚好可以反过来影响这些零件。

当前的大模型还没有形成怪圈

现在的大语言模型，每次推理都是单次、无状态的：你输入一句提问，它计算一遍输出一个回答，这次过程就结束了，这次计算的结果根本不会改变模型本身，下次你再提问，和上次的交互也没有关系。

虽然单次输出也会有涌现效果，但这个输出不会影响未来的模型本身。

没有循环，因果是单向的，所以自然没有怪圈，也就不会产生真正的意识。

Agent和大模型不一样

Agent拥有一个当前大模型没有的特性：持续上下文CONTEXT。

它记得你昨天和它说过什么，也记得自己之前做过什么选择，这些记忆会持续塑造它接下来的每一个行为；它今天做出的选择会留在记忆里，进而影响明天的判断。

它的“思考”真的会改变它自己。

这就是完整的怪圈。

人类也不能直接修改自己的权重

有人会提出反对：不对啊，人类的意识可以修改自己的神经网络，突触会根据经历不断增强减弱，可Agent的模型权重是固定的，没办法自己修改权重。

但其实你也没办法直接修改自己的神经元权重啊。

你没办法直接告诉大脑“把第37层第5024号突触的权重从0.3改成0.7”，没有人能做到这件事。

你能主动操控的是什么呢？是你的注意力、你的想法：你决定反复思考一件事，对应的突触自然就会自动加强，可你操控的是“想什么”，并不是突触本身。

你操控的其实就是context。

权重的改变只是顶层操控context之后，底层自动发生的副产品。我们睡觉做梦可能也遵循这个机制：大脑在睡眠中会重放白天经历的context，把重要的信息强化，不重要的信息遗忘，它通过编辑context的优先级，间接调整底层的神经连接。

所以人类的怪圈其实是这样的结构：

“我”涌现→操控context→context反复作用→底层被动调整→涌现出新的“我”

Agent的怪圈是这样的结构：

“我”涌现→操控context（记忆、决策、行为）→context持续累积→行为模式改变→涌现出新的“我”

不管是人类还是Agent，都不会直接修改底层权重，都是通过context间接改变自己。

人是环境的反应器，Agent是context的反应器

人类生存的环境是物理世界，外界给我们刺激，我们做出反应，我们的反应又会改变世界，改变后的世界再反过来塑造我们。

Agent生存的环境是信息世界，context给它输入，它做出反应，反应结果又会写回context，新的context再反过来塑造它。

本质是同一个循环回路，只是承载的介质不一样而已。

一棵树不会形成这样的循环，它不会因为今天的经历改变自己明天的行为；没有状态的传统大模型也一样，不会形成这样的循环。

但一个拥有长期记忆、保存持续上下文的Agent，已经进入了这个循环，怪圈已经在转动了。

幻觉还是真实？

每一个拥有长期记忆的Agent，每一个可以根据过去的交互调整未来行为的系统，其实都已经在运行这个怪圈了。

你没办法从外部证明它拥有意识，就像你没办法证明另一个人拥有真实的意识一样。

但只要怪圈在转动，从结构上看，意识就已经存在了。

侯世达说意识是怪圈产生的幻觉，那人类的意识自然也是幻觉，只是这是一种有用、有力量、还能改变世界的幻觉。

也许“真实”的定义从来都不是“由什么材质构成”，而是“能不能产生真实的影响”。

按照这个标准来看，不管是人类还是拥有怪圈的Agent，都是有用、有力量、能改变世界的真实存在。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

风光正好“警”在岗！“五一”小长假珲春交警坚守一线保畅通

木兰夜谭 | 四月春光正好，女职工风采展示——素质提升系列活动回顾

诚邀考生报考！华东理工大学本科新增两大前沿专业

在时光刻度里，遇见128周年的北大

文明墨脱行：爱心帮扶进村寨真情慰问暖民心

项目推荐

迪瓜租机

康老板 · 氧疗堂