GPT-4o再秀神操作，OpenAI总裁“再现”授课，网友们认真对待。

2024-05-21

GregOpenAI总裁兼创始人Greg再次展示GPT-4o操作，结果网友直接悼念DALLL。-E

。

直接看效果。

文字拼写达到惊人的一致性！手部的细节，光线，甚至背部的Logo都是完全正确的。

有些网民说：恍惚中还以为自己真的在教书。

还有人感慨图像生成技术发展的飞跃：Holy Cow！

只用了一次迭代，从完全粉碎的文字到风格一致、拼写正确的创作。

01 GPT-让网民直接悼念DALLL4o-E

GPT-自从4o发布以来，简直就被玩疯了，尤其是图像生成这一块。

举例来说，有网友发现，GPT-4o在组合任意图像上边就像打通了任督二脉。

给出两张完全不相关的图片。

结果摇身一变，“伤心蛙版的麦片”，这不是广告设计公司可以直接使用的。

然而，就像生成统计图一样，有一个想法可以翻车...例如，在正态分布之前， 10%的红色染色，没有完成。

还有更多的翻车效果…

所以，有些人认为这可能是DALL。-E，GPT-4o现在还没有办法生成图像。

现在Greg亲自下场呈现GPT-4o的图像生成效果，应该算是一种回应。

评论区当然有网友质疑：这确定是同一个版本吗？能否给出完整的提示？

但是无论如何，OpenAI这次免费大开放，让更多的人可以探索GPT-4o的能力。

举例来说，在前后文能力上，有网友发现它比GPT-4-Turbo要好得多。

但是从情景对话这一场景来看，GPT-与ChatGPT相比，4o更愿意讨论自己的感受和意识。

02 Omni团队大揭秘

Prafullallaomni团队负责人在社交网络上，Dhariwal还表达了他的团队成员的感激之情，并直言这项工作始于一年前。

Prafulla Dhariwal本科毕业于MIT，之后去OpenAI已有7年的历史。

首先，他说GPT-4o是他们团队推出的第一个模型，也是OpenAI的第一个原生多模式模型。

接着又来了一个团队大点名。

James Betker，负责图像和音频生成、数据准备、集成和后续训练。

Jamie Kiros：对GPT-4o的视觉感知负责。

Rowan Zellers：使模型/产品能像人类一样自然地观看视频。

Alexis Conneau：第一个在OpenAI中提出Her愿景的人。在个人介绍中，他指出自己是音频AGI主管。

Gabriel Goh、Ishaan Gulrajani：负责Scaling 与Law有关的工作。

Alex Nichol、Heewoo Jun、Li JING，保证GPT-4o图像生成，3D生成能力。

接着奥特曼也顺手分享了评论，并表示这项工作引发了一场革命，它可以改变我们使用计算机的方式。

所以，有没有用过GPT-4o的朋友？请在评论区分享您的感受

参考链接：

[1]https://twitter.com/gdb/status/1790869434174746805

[2]https://twitter.com/sama/status/1790816449180876804

本文来自微信微信官方账号“量子位”（ID:QbitAI），作者：关注前沿技术，授权发布36氪。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

5.17电信日：联通宽带装维服务保证再次升级！

卢潘霞领导视察养老服务体系建设工作

商店小二解决了燃眉之急，公司送来了“感谢信”！

在奥运资格系列赛中，黄浦警方全力做好各种保障工作。

付涛到白杨镇进行调查

项目推荐

迪瓜租机

康老板 · 氧疗堂