AI大神Karpathy演讲霸屏:软件3.0时代已经到来,提示词就是新代码。

06-21 11:09
不在 OpenAI 的 Andrej Karpathy,永远是传说。

不在 OpenAI 的 Andrej Karpathy,永远是传说。


近日,Karpathy 应邀在 YC AI 创业学校活动发表演讲,一经发表,全世界的网友都开始学习like。



这个演讲看起来很松散,实际上到处埋点。


Karpathy 精心准备了 PPT,整个演讲内容都安排好了:这就像是对编程语言进化史的讲解,从软件开始 1.0 时代开始谈起,到了以后,「喂数据」这是核心。到了 3.0 则是「对模型说咒语」。


再一次强调他「LLM 这是一个新的操作系统」,并且进一步延伸到 AI 心理特征与人类相似,最终得出结论:AI 人类应该得到加强,而不是取代人类。


这是他对 LLM 对时代的理解,也是研究者和研究者 builder 技术世界观。它不再是一个充满激情的预测,而是一个自我整理后的分享:语言正在成为一个控制系统,而我们,每个人都有一部分语言接口。


因为演讲内容太丰富了,我们把它浓缩成了一套「金句卡片」:一句话锚点 一个解释,希望你能像翻卡一样,震撼中心,也许哪个句子就能成为你下一次创作的开始。



Karpathy 讨论了两种对策 LLM 比喻:电网和芯片厂。LLM 与电网类似,发展需要巨大的资金支出。(CapEx)来建设,再通过 API 以计量付费的方式提供服务。与芯片制造商一样,由于构建这需要巨大的投资,而且技术支部发展迅速。



不过,他认为更合适的是把握。 LLM 比喻为操作系统 (Operating Systems)。 他强调,LLM 不像电力或者自来水那样可以随意使用,没有区别。「商品」 。相反,它们是软件生态系统越来越复杂,这一特点促使它们变得越来越复杂。「操作系统」这是一种更加精确的对比。


他把闭源的 LLM 提供商比成 Windows 和 Mac OS,而把开源的 Llama 生态比成 Linux,把 LLM 自身比成 CPU,前后文窗口(Context Windows)比成内存(RAM),而 LLM 工作方式就像操作系统一样,调度这些。「硬件」资源解决问题。



既然 LLM 它正在形成一个复杂的生态系统,而不是一个简单的产品,所以我们可以从计算机系统结构的角度进一步了解大语言模型。作为一个 CPU 模型本身,就是实施运算推理的关键。前后的窗口就是内存,可以用来临时存储各种工作所需的信息。



而且整个工作流程,就像操作系统一样,负责调度 CPU 为了完成客户提出的复杂任务,还有内存等资源。


在 Karpathy 在想象中,大模型不再停留在宏观商业模式中,而是一个全新的计算平台。



就算 LLM 它将成为目前最主流的计算平台,通过聊天框式的纯文本和强大的纯文本直接使用 LLM 「操作系统」 互动的方式,不会长久。


Karpathy 以 Cursor 举例来说,在编程语言中, GUI,使用者可直观地看到红绿高亮显示代码的增删,并使用快捷键(例如 Command Y)迅速接受或拒绝 。这种方法远比用自然语言描述要好。「第二处修改请接受,但否认第一处。」要有效率,要直观得多。



GUI 利用人类强大的视觉处理能力,极大地加速了对人类的视觉处理。 AI 工作成效的「验证」和「审计」阶段。虽然 LLM 其核心是语言模型,但要建立一个真正实用的模型。「可以自动应用」,绝不能忽视 GUI 的力量。


精心设计的 GUI 就是连接人类用户和 AI 「操作系统」它们之间最有效率的桥梁,使人机合作「生成-验证」循环能迅速运转。



Karpathy 提出这些问题,指的是怎样让这些问题? LLM 商品更加自动化——至少部分自动化。将任何传统软件转化为 AI 可驱动的「部分独立应用」必须满足三个前提条件:


-感知 (Perception): AI 需要代理的可能性「看到」人类用户可以看到的所有信息。


-行动 (Action): AI 代理人需要能够执行所有人类用户可以执行的操作。


-监管 (Supervision): 人类监督管理必须有一种机制 AI 随时介入工作,因为 AI 当前系统不可靠。



一个非常重要的结论是,目前大多数软件的页面(各种开关和设置)都是纯粹为人类设计的。这正是实现。 AI 自动化障碍。所以,他的呼吁是:「这一切都必须改变,变得可以访问大语言模型。 」。



身为前特斯拉总监,Karpathy 显然,经验和观点比任何人都要锋利:软件和现实世界的复杂性远远超出想象。这也是他对此的看法。 AI agent 的态度。



对容易举起的东西「agent 元年」,事实上,他非常谨慎。他认为,这可能是「代理十年 (decade of agents)」,而非一年。


归根结底,从一个惊人的演示(99%) 成功)到真正可靠、能够处理所有极端情况的成熟产品(99.999% 成功),中间隔着一个漫长而艰难的鸿沟。



在加入 OpenAI 之前,Karpathy 所以对教学很感兴趣。不仅在斯坦福阶段当助教,自己还制作了一系列科普视频。他一直在想:AI 什么是时代教育?其中一个关键点是:如何让步? AI 不失控。


「失控」的 AI 不能胜任教育的任务。一个完全开放、无结构的指令, AI 缺少方向。甚至是「教我物理」这种任务,也会造成这种任务。 AI 不能出具连贯的教学大纲,明确的知识层次和结构化的教学路径,最终导致教学失败。


这个完美的印证了他之前的关于「代理人反应过度 (over-reactive agent)」这将产生无用的观点。所以,他认为应该把它放在一边。 AI 受人类产出的限制。比如让老师和老师。 AI 创建结构化合作,「课程」。本课程是一种可以审查和检验的中间产品,从而保证了教学水平,避免了教学水平。「迷失方向」的问题。



LLM 还有心理学?至少 Karpathy 相信这个。毕竟,AI 它是通过学习和拟合网络上几乎所有人类编写的文本数据来实践的。


但是,这也意味着,AI 不仅强大,而且弱小——包括超能力,还包括认知缺陷。LLM 拥有百科全书般的知识储备,Karpathy 把它比作电影《雨人》中的主角。但是也有一系列的缺陷,比如幻觉,智力水平参差不齐,还有患者等等。「顺行性遗忘 (anterograde amnesia) 」同样的有限记忆等等。



AI 它是通过大量的人类数据训练出来的,所以它不可避免地会出现类似于人类的心理特征,无论好坏。



毫无疑问,LLM 颠覆了传统的技术传播方向——这就是为什么 Karpathy 说,现在是进入这个行业的好时机。


以往的颠覆性技术,首先由政府和企业使用,然后逐步向客户普及。但是 LLM 相反,它首先通过消费级应用程序(比如问问 ChatGPT 怎样煮鸡蛋)触及大众,而政府和企业在使用上却落后。


全场一场下来,Karpathy 并没有在「画饼」,相反,它给出了一层又一层的新视角,并且是一种不断自我迭代的思维方式——而这正是每个人仍然在学习如何穿上它。「AI 铠甲」真正需要的人。



本文来自微信微信官方账号“APPSO”,作者:发现明天的产品,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com