历时两年研发,GPT - 5重磅登场!奥特曼称其为全球最先进AI模型
北京时间8月8日凌晨1点,OpenAI推出了最新大型人工智能模型GPT - 5,这是该公司目前最智能、快速且实用的AI系统。
OpenAI首席执行官萨姆·奥特曼(Sam Altman)表示,GPT - 5就像一个博士级专家团队,具备内置推理能力,能在编码、数学、写作、医疗和视觉感知等多个领域给出专家级的回答,相比前代模型有显著超越。
GPT - 5现已通过ChatGPT向所有用户开放,涵盖免费、Plus、Pro和Team用户。免费用户可首次体验推理模型,达到限额后会切换至GPT - 5 mini。Plus用户有更高的使用限额,Pro用户能无限制访问GPT - 5及更强大的GPT - 5 Pro。企业版和教育版用户大约一周后可获得访问权限。此外,OpenAI还为开发者提供了GPT - 5、GPT - 5 mini和GPT - 5 nano三种API版本,以满足不同需求。

AIME



GPT - 5在多项基准测试中表现出色,创下新高:数学(AIME 2025无工具得分94.6%)、编码(SWE - bench Verified 74.9%,Aider Polyglot 88%)、多模态理解(MMMU 84.2%)和医疗(HealthBench Hard 46.2%)。
GPT - 5大大减少了“幻觉”情况。在匿名ChatGPT流量测试中,其回答包含事实错误的概率比GPT - 4o低45%,在推理模式下比OpenAI o3低80%。
在LongFact和FActScore等事实性基准测试中,GPT - 5(带推理)的幻觉率约为o3的六分之一,这保证了长篇内容更加准确。OpenAI引入了“安全完成”训练,当模型处理模糊或双重用途问题时,会提供高层次、安全的回答,并透明解释拒绝原因,欺骗率从4.8%降至2.1%。
OpenAI在GPT - 5的开发过程中进行了广泛的安全评估,测试时长达到5000小时。OpenAI称,GPT - 5不会直接拒绝回答可能存在风险的问题,而是采用“安全完成”策略,提供符合安全限制的高层次回答,避免潜在危害。
在简报会上,OpenAI展示了GPT - 5的“氛围编码”功能,用户只需通过简单的文字提示就能生成软件。OpenAI的研究人员让GPT - 5开发一个帮助英语使用者学习法语的网页应用,要求有吸引人的主题,具备闪卡、测验和每日进度跟踪等功能。
OpenAI在两个GPT - 5窗口中输入相同提示,模型在几秒内就生成了两个不同的应用。研究人员表示,这些应用虽“有些粗糙”,但用户可以根据需求进一步调整AI生成的软件,比如更改背景或添加新标签。

微软首席执行官萨蒂亚·纳德拉(Satya Nadella)周四在X平台发帖称:“很难相信从奥特曼在雷德蒙德首次向世界展示GPT - 4到现在仅过去了两年半,技术进步之快令人惊叹。”他提到的是2023年2月奥特曼在微软华盛顿总部展示GPT - 4的场景。
根据微软的博客文章,GPT - 5将很快集成到微软产品中,包括Microsoft 365 Copilot、面向消费者的Copilot以及供开发者将AI模型融入第三方应用的Azure AI Foundry。
企业文件管理公司Box近几周对GPT - 5进行了广泛测试。Box首席执行官亚伦·列维 (Aaron Levie) 称,以往AI模型在处理复杂数学或长文档逻辑时常常失败,但GPT - 5是“彻底的突破”。他在接受CNBC采访时表示:“该模型能保留更多信息,并运用更高水平的推理和逻辑能力进行决策。”(文 / 腾讯科技特约编译无忌,编辑 / 博阳)
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




