OpenAI重磅发布GPT - 5模型:全面面向用户,宛如人类专家
快科技8月8日消息,OpenAI在今日凌晨的直播中,正式推出了GPT - 5模型,宣称这是其旗下最为出色的模型,在编程、数学、写作、健康、视觉感知等众多领域都拥有顶尖性能。
OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)表示,GPT - 5是该公司此前人工智能模型的“重大升级”,还称“与它交流,真的就如同在和任何领域的专家对话”。

从周四起,GPT - 5将逐步向免费用户和付费用户开放。付费用户拥有更高的使用限额,该模型对计算机编程尤其有帮助。
Pro订阅者可无限访问GPT - 5,并能使用GPT - 5 Pro;Plus用户可将其设为日常问题的默认模型,使用量远高于免费用户。

GPT - 5是一个统一的系统,由智能高效模型 + 深度推理模型(GPT - 5 thinking)+ 实时路由器构成。
其中,智能高效模型可解答大多数问题;深度推理模型用于处理更复杂的问题。
实时路由器会依据对话类型、复杂性、工具需求和用户明确意图,迅速决定使用哪种模型,并且会基于真实信号持续训练改进。
一旦达到使用限制,每个模型的精简版将处理剩余查询,OpenAI未来会把这些功能整合到一个单一模型中。

在基准测试中,GPT - 5表现优于之前的模型,回答问题速度更快,对实际问题的解答更有帮助,减少了幻觉、改进了指令遵循并最大程度减少了谄媚。
尤其在写作、编程和健康咨询这三个ChatGPT最常见的应用场景中,其表现有明显提升。

编程方面:它是迄今为止最强的编程模型,在复杂前端生成和大型代码库调试上有显著改进,能根据单个提示创建美观且响应迅速的网站、应用程序和游戏等。
创意表达与写作方面:能把粗略想法转化为有文学深度和节奏的动人作品,更善于处理结构模糊的写作,对日常写作任务也更有帮助。
健康方面:在健康相关问题上表现最佳,在HealthBench上的得分显著高于以往任何模型,能更主动地标记潜在问题并提问以提供更有帮助的答案,还能根据用户的背景、知识水平和地理位置提供更精确可靠的响应,但不能替代医疗专业人员。
在数学(AIME 2025无工具时94.6%)、真实世界编程(SWE - bench Verified 74.9%、Aider Polyglot 88%)、多模态理解(MMMU 84.2%)和健康(HealthBench Hard 46.2%)等方面创造了新的最先进水平。


GPT - 5 Pro凭借扩展推理,在GPQA上也创造了新的最先进水平,无工具时得分88.4%。
GPT - 5 Pro用于最具挑战性、最复杂的任务,替代OpenAI o3 - Pro,它思考时间更长,使用规模化但高效的并行测试时计算,能提供最高质量和最全面的答案。
在多个具有挑战性的智力基准测试中表现最佳,在超过1000个有经济价值的真实世界推理提示评估中,外部专家在67.8%的情况下更青睐GPT - 5 Pro,其主要错误减少22%,在健康、科学、数学和编程方面表现出色。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




