历时两年研发，GPT - 5重磅登场！奥特曼称其为全球最先进AI模型

2025-08-09

北京时间8月8日凌晨1点，OpenAI推出了最新大型人工智能模型GPT - 5，这是该公司目前最智能、快速且实用的AI系统。

OpenAI首席执行官萨姆·奥特曼（Sam Altman）表示，GPT - 5就像一个博士级专家团队，具备内置推理能力，能在编码、数学、写作、医疗和视觉感知等多个领域给出专家级的回答，相比前代模型有显著超越。

GPT - 5现已通过ChatGPT向所有用户开放，涵盖免费、Plus、Pro和Team用户。免费用户可首次体验推理模型，达到限额后会切换至GPT - 5 mini。Plus用户有更高的使用限额，Pro用户能无限制访问GPT - 5及更强大的GPT - 5 Pro。企业版和教育版用户大约一周后可获得访问权限。此外，OpenAI还为开发者提供了GPT - 5、GPT - 5 mini和GPT - 5 nano三种API版本，以满足不同需求。

AIME

GPT - 5在多项基准测试中表现出色，创下新高：数学（AIME 2025无工具得分94.6%）、编码（SWE - bench Verified 74.9%，Aider Polyglot 88%）、多模态理解（MMMU 84.2%）和医疗（HealthBench Hard 46.2%）。

GPT - 5大大减少了“幻觉”情况。在匿名ChatGPT流量测试中，其回答包含事实错误的概率比GPT - 4o低45%，在推理模式下比OpenAI o3低80%。

在LongFact和FActScore等事实性基准测试中，GPT - 5（带推理）的幻觉率约为o3的六分之一，这保证了长篇内容更加准确。OpenAI引入了“安全完成”训练，当模型处理模糊或双重用途问题时，会提供高层次、安全的回答，并透明解释拒绝原因，欺骗率从4.8%降至2.1%。

OpenAI在GPT - 5的开发过程中进行了广泛的安全评估，测试时长达到5000小时。OpenAI称，GPT - 5不会直接拒绝回答可能存在风险的问题，而是采用“安全完成”策略，提供符合安全限制的高层次回答，避免潜在危害。

在简报会上，OpenAI展示了GPT - 5的“氛围编码”功能，用户只需通过简单的文字提示就能生成软件。OpenAI的研究人员让GPT - 5开发一个帮助英语使用者学习法语的网页应用，要求有吸引人的主题，具备闪卡、测验和每日进度跟踪等功能。

OpenAI在两个GPT - 5窗口中输入相同提示，模型在几秒内就生成了两个不同的应用。研究人员表示，这些应用虽“有些粗糙”，但用户可以根据需求进一步调整AI生成的软件，比如更改背景或添加新标签。

微软首席执行官萨蒂亚·纳德拉（Satya Nadella）周四在X平台发帖称：“很难相信从奥特曼在雷德蒙德首次向世界展示GPT - 4到现在仅过去了两年半，技术进步之快令人惊叹。”他提到的是2023年2月奥特曼在微软华盛顿总部展示GPT - 4的场景。

根据微软的博客文章，GPT - 5将很快集成到微软产品中，包括Microsoft 365 Copilot、面向消费者的Copilot以及供开发者将AI模型融入第三方应用的Azure AI Foundry。

企业文件管理公司Box近几周对GPT - 5进行了广泛测试。Box首席执行官亚伦·列维 (Aaron Levie) 称，以往AI模型在处理复杂数学或长文档逻辑时常常失败，但GPT - 5是“彻底的突破”。他在接受CNBC采访时表示：“该模型能保留更多信息，并运用更高水平的推理和逻辑能力进行决策。”（文 / 腾讯科技特约编译无忌，编辑 / 博阳）

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

质用车：十款车型无线充电性能大比拼

2025款小鹏G7购车指南：推荐602长续航Max

凌晨2点江西一住户卧室爆炸，竟是手机惹的祸！

汛期需防血吸虫病，接触10秒即可感染！

中青评论：妇产科医生坠楼离世，谨防“医闹”网络化危机

项目推荐

AI云印侠

宾果智能

幸福绩效