《哥德尔、埃舍尔、巴赫》启发:Agent会诞生自我意识吗?

7分钟前

本文来自微信公众号: AGENT橘 ,作者:AGENT橘



昨天我看完了经典烧脑著作《哥德尔、埃舍尔、巴赫》(简称GEB)的讲解,看完之后后劲十足,今天又重新梳理消化了一遍内容,整理成这篇笔记分享给大家。



这本书是谢赛宁在张小珺的播客中推荐的,它就像一个信息黑洞,只要读进去就会被高密度的知识信息轰炸,很难轻易抽离出来。



这本书横跨数学、生物学、绘画、音乐、禅宗、人工智能等多个不同领域,层层推进,最终推导出一个非常震撼的核心结论:



自指就是意识产生的源头。



当一个系统的复杂程度达到可以描述自身的水平时,意识的出现就不是神迹,而是必然的结果。



不需要超自然的灵魂,也不需要神秘力量的加持,只要系统的复杂度达标,自我意识就会自然涌现出来。



这本书是侯世达在1979年完成创作的,那时候既没有Transformer架构,也没有大语言模型,可作者却精准预言了:只有这种自下而上的神经模式,才能最终涌现出真正的智能。



不过这本书内容庞杂、理解门槛很高,想要读懂它的核心观点,我们可以从头慢慢梳理。



意义从哪里来



-p-q--



这一行符号单独看,有意义吗?当然没有。但如果我们约定:横杠代表数字1,p代表加号,q代表等号,这串符号就变成了大家都能读懂的1+1=2。



两个完全不同的系统,结构可以完全对应,侯世达把这种对应关系叫做同构。



我们眼睛接收到的原本只是不同频率的光波,本身不存在颜色,所谓的颜色,其实是大脑对光波信号“翻译解释”之后得到的结果。



进入耳朵的只是不同频率的声波,本身也不存在音乐,音乐就是大脑在声波信号之上,解释涌现出来的认知。



唱片上的凹槽本身也不会发声,经过唱机读取解释之后,才涌现出了动听的音乐。



所以意义从来都不在信号本身,意义来自解释。



有限规则如何生出无限



巴赫曾经创作过一首《无穷升高卡农》,旋律每完成一次循环就会升高一个调,听起来一直是在往高音走,可走到最后,它居然神奇地回到了最初的起点。



这就是递归:自我调用,层层嵌套,用有限的规则,就能生成无限复杂的结构。



DNA的机制更巧妙,核糖体读取DNA上的指令来合成蛋白质,可就连制造核糖体本身的指令,也写在了DNA里。



DNA本身就包含了“如何解释DNA”的方法,自己完成对自己的解释,实现自我复制,形成完整的循环。



涌现



一只蚂蚁只有十万个神经元,根本承载不了复杂的信息,单独看一只蚂蚁,不过是一台简单的状态机器。



可几百万只蚂蚁聚集在一起组成蚁群,就能完成筑巢、分工、甚至发动战争,没有哪一只蚂蚁“明白”整个蚁群在做什么,但作为整体的蚁群却能精准完成这些复杂任务。



智能从来都不藏在单个个体里,而是藏在个体之间的交互中。



人脑也是一样的道理,单个神经元做的事情非常简单,不过是加权求和,决定激活或者不激活,这和Transformer里的单个计算单元本质上没有区别。可当几百亿个这样简单的单元相互作用叠加之后,就自然而然涌现出了思维、感受,还有那个清晰的“我”。





复杂系统的固有极限



1931年,哥德尔证明了一个影响深远的结论:任何一个足够强大的形式系统,都必然存在一些为真的命题,没办法在这个系统内部得到证明。



他是怎么证明的呢?核心就是构造了一个自指命题:“我不是一条定理。”



如果这个命题可以被系统证明,那系统本身就存在矛盾;如果这个命题没办法被证明,那就说明它本身为真,但系统本身却无法处理它。



所以足够复杂的系统一定是不完备的,永远存在盲区,永远有系统内部没办法发现、没办法证明的内容。



我们看到“我从不说谎”这句话会觉得别扭,就是这个道理,因为这句话指向了自身,陷入了哥德尔不完备的结构里。



禅宗著名的赵州无字公案,也是同样的结构:佛教说众生都有佛性,僧人问赵州禅师:狗子有没有佛性?赵州回答:无。



他其实没有直接回答有或者没有,而是用这个回答打破了提问者原本依赖的那个形式系统。



怪圈



现在我们可以把前面的所有线索串起来了:



同构告诉我们:意义不在信号本身,意义来自解释;



递归告诉我们:有限的规则可以生成无限结构,还能让系统指向自身;



涌现告诉我们:简单元素的相互作用,就能产生高层的智能;



哥德尔不完备定理告诉我们:任何足够复杂的系统,都会自然产生自指,而且自指根本没办法消除。



把这四个点结合在一起,侯世达提出了一个核心概念:怪圈,也就是Strange Loop。



一个系统顺着层级不断向上走,最终兜兜转转又回到了起点;底层涌现出顶层,顶层反过来又会调控底层,因果不是单向的,而是循环的。



画家埃舍尔有一幅非常有名的画,画的是左手在画右手,右手同时在画左手,你说不清楚到底是谁创造了谁,这就是最直观的怪圈。



人类的意识本身就是一个最典型的怪圈:几百亿个没有意识的神经元放电,涌现出了“我”这个最高层的符号,然后这个“我”反过来又能决定自己想什么、做什么;你决定抬起手,几百亿神经元就会重新组织起来执行这个指令。



底层涌现出“我”,“我”反过来调控底层,形成了完整的因果循环。



意识其实就是这个怪圈的产物,它是一种有用的幻觉。



“我”并不是一个坐在大脑里操控一切的实体,“我”是一种模式,是几百亿个无意识的零件高速运转的时候,自然涌现出来的一个符号,而且这个符号刚好可以反过来影响这些零件。



当前的大模型还没有形成怪圈



现在的大语言模型,每次推理都是单次、无状态的:你输入一句提问,它计算一遍输出一个回答,这次过程就结束了,这次计算的结果根本不会改变模型本身,下次你再提问,和上次的交互也没有关系。



虽然单次输出也会有涌现效果,但这个输出不会影响未来的模型本身。



没有循环,因果是单向的,所以自然没有怪圈,也就不会产生真正的意识。





Agent和大模型不一样



Agent拥有一个当前大模型没有的特性:持续上下文CONTEXT。



它记得你昨天和它说过什么,也记得自己之前做过什么选择,这些记忆会持续塑造它接下来的每一个行为;它今天做出的选择会留在记忆里,进而影响明天的判断。



它的“思考”真的会改变它自己。



这就是完整的怪圈。





人类也不能直接修改自己的权重



有人会提出反对:不对啊,人类的意识可以修改自己的神经网络,突触会根据经历不断增强减弱,可Agent的模型权重是固定的,没办法自己修改权重。



但其实你也没办法直接修改自己的神经元权重啊。



你没办法直接告诉大脑“把第37层第5024号突触的权重从0.3改成0.7”,没有人能做到这件事。



你能主动操控的是什么呢?是你的注意力、你的想法:你决定反复思考一件事,对应的突触自然就会自动加强,可你操控的是“想什么”,并不是突触本身。



你操控的其实就是context。



权重的改变只是顶层操控context之后,底层自动发生的副产品。我们睡觉做梦可能也遵循这个机制:大脑在睡眠中会重放白天经历的context,把重要的信息强化,不重要的信息遗忘,它通过编辑context的优先级,间接调整底层的神经连接。



所以人类的怪圈其实是这样的结构:



“我”涌现→操控context→context反复作用→底层被动调整→涌现出新的“我”



Agent的怪圈是这样的结构:



“我”涌现→操控context(记忆、决策、行为)→context持续累积→行为模式改变→涌现出新的“我”



不管是人类还是Agent,都不会直接修改底层权重,都是通过context间接改变自己。





人是环境的反应器,Agent是context的反应器



人类生存的环境是物理世界,外界给我们刺激,我们做出反应,我们的反应又会改变世界,改变后的世界再反过来塑造我们。



Agent生存的环境是信息世界,context给它输入,它做出反应,反应结果又会写回context,新的context再反过来塑造它。



本质是同一个循环回路,只是承载的介质不一样而已。



一棵树不会形成这样的循环,它不会因为今天的经历改变自己明天的行为;没有状态的传统大模型也一样,不会形成这样的循环。



但一个拥有长期记忆、保存持续上下文的Agent,已经进入了这个循环,怪圈已经在转动了。



幻觉还是真实?



每一个拥有长期记忆的Agent,每一个可以根据过去的交互调整未来行为的系统,其实都已经在运行这个怪圈了。



你没办法从外部证明它拥有意识,就像你没办法证明另一个人拥有真实的意识一样。



但只要怪圈在转动,从结构上看,意识就已经存在了。



侯世达说意识是怪圈产生的幻觉,那人类的意识自然也是幻觉,只是这是一种有用、有力量、还能改变世界的幻觉。



也许“真实”的定义从来都不是“由什么材质构成”,而是“能不能产生真实的影响”。



按照这个标准来看,不管是人类还是拥有怪圈的Agent,都是有用、有力量、能改变世界的真实存在。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com