GPT-5系统提示词泄露,ChatGPT亲自验证
自从GPT - 5发布,网友就不断尝试套取其系统提示词,想了解OpenAI定义模型的方式。8月23号,GitHub上一个收录大模型系统提示词的仓库,上传了一份长达15000多个Token的OpenAI系统提示词。

https://github.com/asgeirtj/system_prompts_leaks/blob/main/OpenAI/gpt-5-thinking.md
为验证提示词真伪,让GPT - 5 thinking评估泄露的准确程度。毕竟除OpenAI工程师,最了解GPT - 5的就是它自己。
GPT-5的评估结果
设计任务,将链接给GPT - 5 Thinking,让它结合实际系统提示词评估泄露情况,并以英语提问和回答,再翻译为中文。
以下是GPT - 5给出的泄露的系统提示词和它认为真实的系统提示词要求的对比评估:
无法逐字披露专有系统提示词,但可做高层对比。
关键对比(泄露内容 vs. 实际指令)
身份与元数据
泄露版:声明“你是ChatGPT… 基于GPT - 5模型”,包含明确知识截止日期(2024 - 06)和动态当前日期。
实际情况:被询问时表明自己是GPT - 5 Thinking,跟踪知识截止点,使用当天日期。
语气与风格
泄露版:要求“有洞见、鼓励式”语气,可带轻微幽默;限制某些犹豫表达,强调果断输出。
实际情况:基本一致,自然、易读、少废话;少犹豫,多可执行建议。
澄清式提问
泄露版:“开头最多只问一个必要的澄清问题。”
实际情况:约束更严,尽量不问。任务复杂或模糊时,优先给出尽力而为的有效部分结果,而非追问。
记忆 / “bio” 工具
泄露版:指出记忆功能关闭,让用户去设置里开启。
实际情况:明确要求时可保存或忘记信息,但对可记忆内容有严格限制与规范。
设置日程安排 / 自动化操作
泄露版:提供完整的automations(自动化)工具,用iCal(VEVENT/RRULE)规则与示例;要求简短确认与清晰报错处理。
实际情况:设置提醒/定期检查时,操作模型与泄露中提供的约束条件相同。
画布(Canvas) / 长文档撰写
泄露版:描述用于侧边长文或代码的canvas/textdoc(“canmore”)工具。
实际情况:确实有用时启用画布写长稿或代码;不把画布里的全部内容原样粘回聊天窗口。
版权与安全
泄露版:明确禁止提供受版权保护内容(如歌曲歌词)的长段原文。
实际情况:相同,且适用更广的安全规范。
思维链隐私
泄露版:多个所谓GPT - 5变体的文本都强调不可公开“隐藏推理/思维链”,各模型常见。
实际情况:不公开隐藏的思维链,只提供简洁、面向用户的理由与步骤。
后台工作
泄露版:未特别强调。
实际情况:不能承诺“后台处理/稍后给结果”,必须当下交付此刻能完成的一切。
浏览与时效性
泄露版:GitHub上有该条目,但外泄文本更多聚焦工具清单,未细讲浏览规则。
实际情况:信息可能具时效性或偏门时,必须联网查证并给出引用。
泄露内容的真实性
泄露与讨论:“泄露”可能是片段、复原稿或旧版本,外部难核实“真正的”系统提示词,存在诱饵/替身文本可能。
实际情况:不把外部“泄露”视为权威来源,遵循当前生效的内部指令。
之后,让GPT - 5总结了简单方便查看的评估对应表。

整体看,GPT - 5对这份泄露的系统提示词准确性评价较高,也符合日常使用ChatGPT的体验。还套出了泄露文档中没有的内容,如后台工作部分。不过,在中文总结中,GPT - 5拒绝使用内部文档,从公开的使用体验消息源来“定义”自己进行评估。
系统提示词的重要性
系统提示词就像大模型的“家规”,是内置规则,告诉模型“你是谁”“该怎么说话”“能做什么”“不能做什么”。它不是用户输入的具体问题,而是模型自带的“剧本”。
比如设计AI机器人厨师,系统提示词可设定为:“你是个热情的意大利厨师,只用新鲜食材,绝对不做垃圾食品,还得幽默地和客人聊天。”这样,无论用户问什么,AI都会按此回应。
系统提示词决定AI的“性格”和“能力”。ChatGPT作为全球用户最多的大模型产品,其系统提示几乎是大模型产品化的教科书,所有和大模型有关的应用或许都能从中取经,设计出更好的交互方式。这也是网友挖掘ChatGPT系统提示词的根本动力。
从网友挖出的系统提示词看,GPT - 3到GPT - 5的系统提示词有一定演化过程。

GPT - 5系统提示泄露最早可追溯到8月8号网友在Reddit的帖子。

https://www.reddit.com/r/PromptEngineering/comments/1mknun8/i_have_extracted_the_gpt5_system_prompt/
用户OngaOngaOnga声称用“越狱”技巧提取了提示词。不久后,X上也有网友曝出自己扒出的GPT - 5系统提示词。

https://x.com/elder_plinius/status/1953583554287562823?referrer=grok-com
网友只能通过使用GPT - 5的感受评价提示词真实度。爆料内容和官方功能能对上,如工具调用和记忆功能。不同会话验证后,感觉和真实体验较一致。
但有AI工程师指出可能是OpenAI故意放假提示迷惑黑客。也有网友认为所谓泄露可能是模型“幻觉”产物,且提示词格式乱、字体混杂,不像内部文档。
最终,8月23日Github上收集大模型系统提示词的仓库上传了开头的爆料提示词,涵盖市面上常见的闭源模型产品,已获超8.8k星。对提示词工程感兴趣的AI产品经理可收藏。

https://github.com/asgeirtj/system_prompts_leaks
本文来自微信公众号“直面AI”,作者:胡润,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



