OpenAI总裁揭秘GPT - 5推理范式变革,计算成AGI实现关键

2025-08-19

OpenAI的AGI发展路径,总裁Greg Brockman在最新访谈中清晰阐述。

技术上,从文本生成转向强化学习的推理范式,在现实世界中试错并获取反馈;资源策略方面,持续投入大规模计算资源;落地环节,把模型封装成Agent,将模型能力打包成可审计的服务进程。

此次访谈由AI播客Latent Space主持,与Brockman探讨了OpenAI的AGI整体技术路线与资源策略,同时其落地布局和对未来的思考也逐渐明晰。

总结Brockman的核心观点如下:模型的现实交互能力不断增强,这是下一代AGI的关键;AGI的主要瓶颈在于计算,计算量决定AI研究和发展的速度与深度;AGI的目标是让大模型融入企业和个人工作流,实现手段是Agent;将模型应用于现实世界极具价值,各领域有很多待挖掘的机会。

模型推理范式的转变

谈及OpenAI刚发布的GPT - 5,Brockman认为这是AI领域的重大范式转变。作为OpenAI首个混合模型,它旨在缩小GPT系列与AGI的差距。

训练GPT - 4后,OpenAI思考:为什么它不是AGI?GPT - 4虽能进行连贯对话,但可靠性不足,会犯错甚至偏离方向。因此,需要在现实世界测试想法,通过强化学习获取反馈以提高可靠性。

OpenAI早期的Dota项目就采用了纯强化学习,能从随机初始化状态学习复杂行为。

从GPT - 4完成起,OpenAI转向新推理范式,先让模型通过监督数据学会对话,再借助强化学习在环境中反复试错。传统模型训练是一次性训练后大量推理,而GPT - 5借助强化学习,在推理中生成数据并重复训练,将现实观测反馈到模型。

这种新范式改变了所需数据规模,强化学习只需从10到100个任务中学习复杂行为,而传统预训练可能需数十万个示例。这也表明模型的现实交互能力在增强,是下一代AGI的关键组成部分。

计算能力决定AGI开发上限

被问及AGI开发的主要瓶颈时,Brockman明确表示是计算。他认为,更多计算能力能让OpenAI找到迭代和提升模型性能的方法,计算量决定AI研究和发展的速度与深度。

如Dota项目中,大家认为PPO算法无法扩展,但通过增加内核数量实现了性能提升,说明扩大计算资源可解决算法壁垒。

GPT - 5的强化学习范式虽样本效率高,但重复学会一项任务需模型进行数万次尝试,需要大量计算支撑。

图灵提出的“超临界学习”概念,要求机器深入思考并更新知识体系,这也需要更多计算资源。OpenAI的目标是探索创造性消耗计算的方式,实现高级学习能力。

Brockman将计算比作基本燃料,能将能量转化为模型权重中的势能,推动模型有效操作。模型训练完成后可反复利用,分摊计算成本。

他预测最终的AGI将是模型管理器,结合小型本地模型和大型云推理器实现自适应计算。GPT - 5的多模型混合和路由机制是初步尝试,结合推理和非推理模型,根据场景选择合适模型。

推理模型适用于深度智能且有思考时间的场景,非推理模型用于快速输出。这种复合模型利用计算灵活性,组合不同能力和成本的模型,是AGI可能的形态。在AI驱动的未来经济中,计算资源需求高,获取和分配计算资源很重要。

让大模型进入生产

Brockman强调,模型要成为现实生产线的一部分。AGI的目标是让大模型融入企业和个人工作流,而非停留在论文和演示中。

具体落地方式是将模型封装成Agent,打包成可审计的服务进程。Brockman认为这种交互像与资深同事协作,关键是可控性,可随时检查和回滚。

为确保高权限Agent可控,OpenAI设计了双层“纵深防御”:模型内部,对system、developer、user三种指令排序,丢弃不可信指令;模型外部,将高危操作拆分成最小粒度,通过多级沙箱确认。

他用数据库安全类比,就像防SQL注入,先堵底层漏洞,再叠加防护,系统更稳固。

除安全防护,与人类价值对齐也很重要。工程团队先去除不受欢迎的“人格”,再将剩余“人格”放入公开竞技场评分,形成模型与社会偏好的协同进化,保证模型能力升级不脱离人类共识,为在线学习打基础。

为增强生态黏性,OpenAI将轻量级开源作为第二驱动力。Brockman认为开发者沉淀工具链,就默认采纳了OpenAI的技术栈。

“各个领域还有大量尚未采摘的果实”

展望未来,Brockman认为值得投入的是将现有智能融入具体行业流程,而非打造更炫的“模型包装器”。他提醒各行业链规模大,将模型应用于现实世界有很大价值,各领域有很多机会。

他建议开发者和创业者深入行业一线,了解细节,用AI填补缺口,而非只做接口封装。

被问到给2045年的自己留便签,他的愿景是“多星际生活”和“真正的丰裕社会”。他认为按当前技术发展速度,二十年后很多科幻情节都可能实现,唯一限制是物质搬运的物理极限。

同时,他提醒计算资源会稀缺,即便物质需求被自动化满足,人们仍会追求更多算力。

如果穿越回18岁,他想告诉自己值得攻克的问题会增多。在AI渗透各行业的背景下,机遇随技术发展而增加,真正的挑战是保持好奇心,敢于进入新领域。

参考链接:[1]https://www.youtube.com/watch?v=35ZWesLrv5A

本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com