GPT-4o再秀神操作,OpenAI总裁“再现”授课,网友们认真对待。

05-21 04:25

GregOpenAI总裁兼创始人Greg再次展示GPT-4o操作,结果网友直接悼念DALLL。-E



直接看效果。


文字拼写达到惊人的一致性!手部的细节,光线,甚至背部的Logo都是完全正确的。


有些网民说:恍惚中还以为自己真的在教书。


还有人感慨图像生成技术发展的飞跃:Holy Cow!


只用了一次迭代,从完全粉碎的文字到风格一致、拼写正确的创作。



01 GPT-让网民直接悼念DALLL4o-E


GPT-自从4o发布以来,简直就被玩疯了,尤其是图像生成这一块。


举例来说,有网友发现,GPT-4o在组合任意图像上边就像打通了任督二脉。


给出两张完全不相关的图片。


结果摇身一变,“伤心蛙版的麦片”,这不是广告设计公司可以直接使用的。


然而,就像生成统计图一样,有一个想法可以翻车...例如,在正态分布之前, 10%的红色染色,没有完成。


还有更多的翻车效果…



所以,有些人认为这可能是DALL。-E,GPT-4o现在还没有办法生成图像。


现在Greg亲自下场呈现GPT-4o的图像生成效果,应该算是一种回应。


评论区当然有网友质疑:这确定是同一个版本吗?能否给出完整的提示?


但是无论如何,OpenAI这次免费大开放,让更多的人可以探索GPT-4o的能力。


举例来说,在前后文能力上,有网友发现它比GPT-4-Turbo要好得多。


但是从情景对话这一场景来看,GPT-与ChatGPT相比,4o更愿意讨论自己的感受和意识。



02 Omni团队大揭秘


Prafullallaomni团队负责人 在社交网络上,Dhariwal还表达了他的团队成员的感激之情,并直言这项工作始于一年前。


Prafulla Dhariwal本科毕业于MIT,之后去OpenAI已有7年的历史。



首先,他说GPT-4o是他们团队推出的第一个模型,也是OpenAI的第一个原生多模式模型。



接着又来了一个团队大点名。


James Betker,负责图像和音频生成、数据准备、集成和后续训练。


Jamie Kiros:对GPT-4o的视觉感知负责。


Rowan Zellers:使模型/产品能像人类一样自然地观看视频。


Alexis Conneau:第一个在OpenAI中提出Her愿景的人。在个人介绍中,他指出自己是音频AGI主管。


Gabriel Goh、Ishaan Gulrajani:负责Scaling 与Law有关的工作。


Alex Nichol、Heewoo Jun、Li JING,保证GPT-4o图像生成,3D生成能力。


接着奥特曼也顺手分享了评论,并表示这项工作引发了一场革命,它可以改变我们使用计算机的方式。


所以,有没有用过GPT-4o的朋友?请在评论区分享您的感受


参考链接:


[1]https://twitter.com/gdb/status/1790869434174746805


[2]https://twitter.com/sama/status/1790816449180876804


本文来自微信微信官方账号“量子位”(ID:QbitAI),作者:关注前沿技术,授权发布36氪。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com