OpenAI重磅更新定档周一,奥特曼暗示将会有“法术”

2024-05-16

OpenAI终于要放大了!官方宣布将于周一在线直播,预计将发布全新的AI语音助手,以及ChatGPT、GPT-四是一系列更新。奥特曼澄清,没有GPT-5,也没有搜索引擎!


确定,没有GPT-5,没有搜索引擎,但是还是会有惊喜!


今天,OpenAI正式宣布将于13日,下周一上午10点(太平洋时间)开始在线直播。


届时,将会有全新的ChatGPT demo演示,GPT-4升级更新。


而且Altman本人更加兴奋地表示,「对于我来说,感觉就像法术一样。」。


原本,发布「搜索引擎」这个事件基本上是真锤,甚至连路透援引内部人士的消息这篇报道,昨天在全网疯狂。


不过,发布时间是对的,但是奥特曼突然改变主意,直言不讳。「没有搜索引擎」。


根据网友的爆料,这是OpenAI投出的诱饵,目的是抓住内部泄密者。而且经常给Jimmyy。 Apples、OpenAI已经解雇了Flowers泄露的爆料者。


不得不说,OpenAI的套路还是很深的。


所以,万众期待的GPT-5没有,确定后再确定。「搜索引擎」下周一OpenAI也没有。「魔法」到底是啥?


据Information独家报道,OpenAI正在开发一个全方位的AI语音助手,估计下周会显示。


通过声音和文字,这项新技术可以与人交流,可以听到不同人的语气、语气,并且可以识别物体和图像。


网民们纷纷表示,还没有等到GPT-5的那一天。


01 Her即将实现!AI语音助手即将到来


事实上,OpenAI希望能够像人类一样开发AI进行交流。


Altman曾经说过,他对Spike说。 由Jonze执导的电影《Her》对此感兴趣,并称之为前瞻性。


这部电影讲述了主人公爱上一个对话操作系统的故事。——Semantha,而且在互动的过程中,AI也逐渐熟悉了他。


「她」记住他的故事,他的习惯,也发展了自己的个性。


所以,OpenAI一开始就致力于最终开发类似的产品。《Her》里面的虚拟助手,同时让现在的语音助手,比如Siri更好。



新型号包括音频输入、音频输出功能和更好的推理能力。在一些查询中,GPT-4 Turbo


据两位知情人士透露,OpenAI已经向一些客户展示了这项新技术,包括许多能力,包括比目前的模型逻辑推理能力更好。


而且,预计在下周一的活动中,这款高级AI将首次公开展示。


可以肯定的是,OpenAI这波操作又一次截断了胡谷歌,占据了抢眼的机会。


预计谷歌将于14日召开I/O大会(OpenAI掐点的直播时间真的很及时,不会给谷歌留下喘息的机会)


根据网民的发现,Altman的官方公告不会发布。「搜索引擎」,谷歌股价立即飙升。


准确地识别语气语气,但是体积太大无法安装手机

OpenAI团队确信它具有视觉效果。 AI助手的音频能力,可能会像智能手机一样,给世界带来颠覆性的变化。


ChatGPT,这只是强大AI助手的雏形。


从理论上讲,他们想象这个AI助手能够完成不可能完成的任务。


比如引导学生写论文,处理数学问题,或者提供及时丰富的信息、翻译标志,甚至指导如何修理故障车。



遗憾的是,OpenAI这款AI目前体积太大,根本无法在个人智能终端上运行。


但是,用户可以在短时间内使用基于云的版本来提高OpenAI已经支持的软件功能,例如自动客户服务智能体。


据了解这个AI的人说,新软件的音频功能可以帮助他们更准确地理解来电者的音频功能。「语气」,当他们提出要求时,他们是否使用?「讽刺语气」。


现在,OpenAI已开发用于转录音频(Whisper)以及文本转换语言(TTS)模型。


这些能力集成在ChatGPT的背后,但是在使用的时候,需要各自调用这些工具。


据报道,OpenAI即将推出的新模型将这些能力融入到一个模型中,即创建一个模型「原生多模态模型」。


这款全新的多模态模型,在分析图像和音频方面表现更好,同时其响应速度也超过了那些能力较弱的模型。


第一次体验微软

一如既往,OpenAI更新当天,「金主父亲」微软,一定是第一个使用新功能的人。


据估计,微软将使用OpenAI新产品来升级他们的语音助手。


而且,他们想要试图压缩这项技术,以便将其压缩。「放进」在配置前摄像头的可穿戴设备中,可以捕捉到用户的周围环境。


然而,目前尚不清楚OpenAI什么时候会为付费用户提供这些新功能,但最终目标是将其纳入ChatGPT的免费版本。


根据一位经验丰富的人士的说法,OpenAI的目的是使AI模型的运行成本低于目前收费最先进的模型GPT-4。-Turbo。


同时,他也指出,新模型在回答某些问题时表现得更好。但是,它仍然会出现。「幻觉」。


02 GPT-五年年底前发,冰山下隐藏的秘密


OpenAI的领先优势,几乎无人能及。


谷歌高管一直梦想着用AI开发一个强大的助手。


去年12年,谷歌首次展示了AI对话。「Gemini」,能对人的语音命令进行实时响应,并识别人类正在观看的照片。


有一段时间,这段宣传视频在全网引起了强烈的反响,让很多人瞬间对谷歌有了特别的看法。


没想到,一天之前,视频竟被曝光。「造假」?!


随后谷歌解释说,这些能力的实现,需要研究人员通过图片和文字指令来引导模型,而不是视频所展示的简单对话。


此后,随着Gemini的迭代升级,除了分析图像和文本外,还增加了一些新的功能,还可以分析音频。


即便如此,它仍然不能理解大多数传统语音命令,也不能像Siri和Google那样。 其他语音助手,如Assistant,与用户进行交流。


而且OpenAI即将发布的AI语音助手,也许对于谷歌来说,这是另一个致命的打击。


另外,OpenAI也在尽最大努力确保自己在AI领域的领先水平,不会被推动。「开源王牌」Meta赶超。


今年4月,Llama 8B版本和70B版本发布,并预测400B版本 开源模型,直接狙击GPT-4。


而具有「音频 视觉」AI模型的能力,只是OpenAI正在开发的许多产品之一。


尽管这次不会发布「网上搜索引擎」,但是这个问题的确在OpenAI内部推广,只是为了和谷歌搜索竞争。


归根结底,OpenAI已经在上周的主页上展示了一个新的UI。


另外,OpenAI还在开发一种叫做自动化的软件。「智能计算机操作体」(computer-using agent)。


该软件有望加快软件开发和其它计算机相关任务的发展。


另外,今年年初,AI视频生成器Sora的出现,虽然目前还没有公开发布,但在好莱坞已经掀起了巨大的震动。


更加重要的是,GPT-5也在默默推进,明显优于GPT-4。据知情人士透露,OpenAI可能会在今年年底前完成GPT-5的研发,并公开发布。



OpenAI之所以在商品和AI模型的开发上取得快速进展,是因为之前宣布的项目没有得到足够的关注。


举例来说,他们曾经承诺,在今年第一季度,开发者可以通过建立定制的聊天机器人来赚钱。


但是到目前为止,OpenAI还没有推出具体的方法来实现这个目标。



将ChatGPT放入iPhone中,与苹果的合作基本达成。

另外一方面,创造视觉 AI助手可以帮助OpenAI,并将其能力引入数亿甚至数十亿的苹果设备。


就在刚才,彭博报道称,苹果和OpenAI正在敲定一项协议,这似乎已经结束,并且已经基本达成。


这项协议将为今年的iOS提供全新的AI生成能力。


在此之前,苹果和谷歌就Gemini进行了谈判,但还没有达成协议。



说到底,距离苹果今年的开发者大会WWDC(6月10日),留给苹果的时间并不多。


多家媒体爆料称,本次会议将AI整合到新的iOS中。 18系统内。


对每个人的期望,苹果都不想辜负。


硬件配置,OpenAI也要自己做。

另外,Altman还和iPhone设计师Jony一起工作。 Ive合作,开发单独的AI消费设备。


Information曾经报道过,这个硬件可能来自Emerson。 Collective和Thrive 像Capital这样的投资者,筹集了高达10亿美元的资金。


过去一年,AI Pin、Rabbit 像R1这样的AI驱动设备和可穿戴产品蜂拥而至,Altman也希望加入这个阵列。


必须承认,即使推出了OpenAI最先进的AI模型,由于其巨大的规模,也只能在云端运行,并且需要在线运行。


而且将来,如果想要复杂的「视觉 音频」对话AI,可能需要几个月,甚至几年的时间才能在系统上运行。


03 全网大预测:智能体,gpt4-lite...


OpenAI这波官方宣布,可谓戳中了大家的兴奋。


爆料人Jimmy Apples再次泄露,「预计下周,我们将看到智能体的发布。」。


而「搜索引擎」在苹果WWDC大会上,有可能一起发布。


BowenAI研究科学家 Cheng甚至说,它比GPT-5酷得多。


不知道为什么,这个帖子现在已经被删除了。



另一位负责视频生成的OpenAI科学家Willll。 Depue发了一张图片,不知道是什么预示。


另一位网友Siqi 下周一,Chen预测将更新GPT-4模型:


- gpt4-lite:更换gpt-3.5


- gpt4-auto:一个新的模型节点(endpoint),可以自动从网络上搜索数据,集成内部数据来提高响应(不是「搜索引擎」)


- gpt4-lite-auto:类似于gpt4-auto,但是使用了lite版本。




还有人说gpt4-lite即将发布。


辞掉OpenAI,加入谷歌的Logan。 Kilpatrick说,「六个月后,AI领域的情况将完全不同。大多数人会对事物的发展感到惊讶。」。


另外一个问题是,OpenAI这次会不会解释gpt2?


在接下来的一个月里,AI海啸将会爆发。


最近Altman在Alllllan的GPT-5什么时候出现?-In 在Pod中回应,「我甚至不确定我们是否会命名GPT-5」。


他建议,未来可能不再遵循GPT。 N 第一种发布方式,转变为持续的改进过程。


但,GPT-5还得再等一次。


参考资料:


https://www.theinformation.com/articles/openai-develops-ai-voice-assistant-as-it-chases-google-apple


https://www.bloomberg.com/news/articles/2024-05-11/apple-closes-in-on-deal-with-openai-to-put-chatgpt-on-iphone


https://twitter.com/sama/status/1788989777452408943


本文来自微信微信官方账号“新智元”(ID:AI_era),作者:新智元,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com