OpenAI谷歌苹果再次点燃AI之战,谁将担任“Her“时代之王?”
硅谷科技巨头将从下周开始新一轮的AI对决。OpenAI、谷歌、苹果都向AI助手下注,并发布了一系列重磅更新,你准备好了吗?
AI对决的新一轮,即将拉开帷幕!
下星期一,OpenAI将开始在线直播,并正式宣布升级GPT-4,甚至还有一个超级。「AI助手」等着我们。
OpenAI「音频AGI研究负责人」Alexis Conneau已经更改了主页背景,并且和奥特曼一样频率-下周我们将见证Magic。
BowenAI研究科学家 Cheng甚至说,这比GPT-5要酷得多。
所有这些,都预示着真正的「Her」即将登场。
在OpenAI的压力下,谷歌将在第二天的I/O大会上公布模型的新进展,相传还会公布一个名字叫做“OpenAI”「Pixie」由Gemini加持的个人数字助理。
随后,微软将于21日召开Build开发者大会,很有可能将OpenAI的最新能力集成到自己的产品线上,甚至可能透露最新的5000亿参数自主研发模型MAI-1。
此外,苹果WWDC大会也备受期待,将发布iOSWDC大会,集成生成式AI能力。 18系统,并将ChatGPT插入iPhone中。
一系列重磅发布,连续轰炸,简直没有给其他公司喘气的机会。
有些网民问,「苹果正在放弃自己『AJAX』人工智能系统,全力与OpenAI公司合作?OpenAI只是权宜之计,直到他们的AI能力赶上。」?
Gurman,苹果内幕人士,总结了苹果的人工智能战略:
- 设备端LLM(自研)
- 云LLM(自研)
- 聊天机器人(可能是OpenAI,也可能是谷歌)
苹果不打算自己开发聊天机器人,但是意识到市场有需求,所以会从外界获得这项技术。这种策略类似于它在搜索领域的做法。
很明显,目前的情况是,OpenAI与微软甚至苹果通过AI合作捆绑在一起,只剩下谷歌自己一个人战斗。
不知道,这波AI争雄对决,谁赢谁输?
01 ChatGPT可以通话,周一直播再次爆料。
整个网络的焦点仍然是OpenAI。
「她们会发表什么?」,这个话题的热度只增不减,很少有人讨论谷歌I/O大会。
网友Ananay对周一的发布预测有了新的发现:
或者ChatGPT将具有通话能力
事实上,这个功能可以从以下代码、电话、拒绝等关键字中看到。
另外,OpenAI已经部署了webRTC服务器来实现这个功能,最近还配备了这些服务器。
起初,网民们还认为,OpenAI部署WebRTC服务器可能是为了纯语音模式,但现在看来,情况并非如此。
因为这个功能是由Livekit提供的。(这是一个可以提供实时音频和视频通信的解决方案)
以下最新评论说,这是否意味着ChatGPT可以主动打电话给我,而不需要我先打电话?
在电影Her中,人工智能助手Samantha主动打电话给男主角,告诉他一些事情,所以他提出了这个问题。
想像一下,ChatGPT助手主动打电话给你,提示或者查看用户习惯,将是一件多么美好的事情。
但是,Ananay说,这需要用户自己选择允许这个功能。
Hallid.indigo的创始人indigo也进行了全面的预测/趋势猜测。
基于indigo的介绍,GPT-新版本应根据参数大小进行分化,分为多个版本。
昨天,有网友猜测gpt4可能会出现。-lite、gpt4-auto、gpt4-lite-版本发布auto。
而且几天前出现在LMSYS竞技场上的gpt2-chatbot,也许是新版本的轻量级GPT-4。而且,这意味着,GPT-3.5的使命即将结束,最新的轻量级版本可能是免费的,同时API价格大幅下降。
关于奥特曼所说的话「魔法」,GPT-4-gpt4可能是升级后的。-auto,具有独立执行Agent任务的能力,记忆力强,规划能力强。
当然,「AI助手」还把Her带入了现实。
昨天,OpenAI视频生成研究科学家Willl Depue发布了一个来自奇点的logo,这可能还预示着什么。
02 Google,或者推出PixieAI助手
谷歌明确表示,这次会议发布的内容都是关于AI的,这是与OpenAI和微软竞争的关键时期。
据谷歌官网报道,今年的I/O大会将于5月14日下午1点在美东时间举行。
根据推测,谷歌将在搜索引擎中结合生成式AI,使用户能够进行对话式搜索。
另外,谷歌还一直在测试新的搜索功能,例如针对英语学习者的AI对话练习,以及在购物时生成虚拟试穿图像。
不只是搜索引擎,更多的谷歌应用程序也会更深入地集成AI功能,比如Google 帮助用户在Maps中找到合适的餐厅、购物中心和电动汽车充电站。
打电话给客服时转接太久怎么办?
在有人接听之前,谷歌测试的AI新功能甚至可以帮助您自动等待转接。
除各种应用外,操作系统也不能落下。
Android上个月 15开发者的浏览已经发布,谷歌将在I/O大会上进一步介绍其新功能,并且可能会增加更深入的Gemini集成。
当前,在安卓系统中,Geminini是生成AI的主要功能。 Nano驱动,用于各种软件功能。
比如Magice Google可以使用Compose 在Messages等应用程序中提供回复建议,Cinematic Wallpaper使用机器学习帮助用户定制屏幕壁纸。
想象一下,AI进一步参与的安卓会带来哪些更个性化的体验?比如更智能的手机主屏、锁屏界面和状态栏?
在去年的I/O大会上,我们看到了Gemini,一个与ChatGPT竞争的大语言模型。今年会有新的模型吗?
除Gemini的新版本外,也许还可以期待谷歌推出的图像和视频模型。
有网友在Reddit上爆料称,谷歌库存已经测试了三种模式,但尚未向公众发布,估计将达到2024年。 I/O大会亮相。
图像生成模型Imagenen分别是三个模型。 三、两个可以优化图像,补充模型Juno和Miro。
有人说Miro还具有视频生成功能。
另外,谷歌今年可能会在I/O上发布AI助手的新版本。「Pixie」,或许可以取代Google,原来的同类产品。 Assistant。
Pixie由Gemini语言模型驱动,安装在谷歌自己开发的硬件配置Pixel上,我们还不知道其它第三方设备是否开放。
但是在这次I/O大会上,我们不应该看到更新版本的Pixel产品,谷歌最近发布了新版本的Pixel。 8a,并已向用户开放预订购买。
Pixel新版本在网上流出 9外观
预估,Pixel Pixel9和折叠 9 Pro 预计Fold将于今年秋天发布。
03 苹果紧紧抓住救命稻草
同时,面对OpenAI和谷歌来势汹汹的AI语音助手的冲击,网友们对苹果说:
留给苹果的时间不多了!
尽管有消息称OpenAI和苹果将敲定合作协议,使ChatGPT能够进入iPhone,并为今年的iOS系统提供全新的生成AI能力。
但是苹果并不打算放弃自己的Siri。
最近,纽约时代报道称,苹果将对Siri进行升级和重组,以应对其它聊天机器人竞争者。
而且这个决定早就做好了。
苹果高管Craigg2023年初 Federighi和John 在测试了OpenAI新聊天机器人ChatGPT之后,Giannandrea花了几个星期的时间,这让Giannandrea感到困惑。
它们认为生成式人工智能的出现使得Siri显得落后和落后。
作为2011年苹果推出的第一个虚拟助手,Siri一直只满足个人要求,无法跟上客户发起的对话。
例如,有人先询问了旧金山的天气,然后说:「纽约如何?」在这个时候,Siri经常误解顾客的提问。
但是ChatGPT知道顾客想要的是后一个问题的答案。
这家科技巨头在意识到新技术已经超越Siri之后,发起了十多年来最重要的重组。
苹果决心在科技行业的人工智能竞赛中迎头赶上,这将生成人工智能作为公司内部的特殊标杆项目,围绕十年一遇的计划组织员工。
Siri超级进化
根据苹果三位内部人士的消息,苹果将于今年6月10日在年度开发者大会上发布Siri。
在新版本中,基本技术包括新的生成式人工智能,允许Siri与用户聊天,而不是一次回答一个问题。
并使Siri更具对话性和广泛的应用。
苹果公司正在全面拥抱生成AI式AI更新 这一领域处于领先地位的措施之一。
今年iPhone中还增加了内存,以支持其新的Siri功能。
另外,苹果还讨论了包括Google在内的、Cohere和OpenAI 为了获得支持聊天机器人AI模型使用权的可能性,几家公司合作。
另一方面,苹果高管也担心新兴的AI技术将取代iOS作为未来的主要操作系统,威胁苹果在全球智能手机市场的主导地位。
此外,这项新技术也可以推动AI应用(AI智能系统)的核心生态系统。
这个App可能会削弱苹果。 Store,这家商店的年销售额约为240亿美元。
但是苹果更担心的是,如果不能开发自己的AI系统,iPhone可能会在与其它先进技术的比较中变成「哑巴手机」,失去市场。
目前,iPhone占全球智能手机利润的85%,销售额超过2000亿美元。
能预料到这一损失是不可估量的,也是苹果无法接受的。
随着这一困境的紧迫感,苹果取消了另一项重大投资——
一项耗资100亿美元的无人驾驶汽车项目,并派遣了100多名工程师进行AI开发。
此外,苹果还将继续探索建立iPhone和Mac处理器驱动服务器的设备流程工具的一致性。
在内部人士的爆料中,苹果对Siri的升级并不是让Siri与ChatGPT竞争诗歌创作等内容产生的部分,而是让Siri致力于处理其原始任务:
包括设置闹钟,建立日历备忘提示,在采购清单中添加物品,并总结信息内容。
苹果计划声称升级后的Siri将比竞争公司的人工智能提供更私人的服务,而且成本更高。
因为Siri是处理iPhone上的请求,所以避免了云中数据的泄露和云计算的成本。
但是,苹果正面临着安装在iPhone上的小型人工智能系统的风险:
研究表明,较小的人工智能系统可能会导致较大的系统产生幻觉。
TommSiri创始人 Gruber表示:
「Siri的目标永远是创建一个能够理解语言和上下文的对话界面,但是这是一个难题。
当技术发生变化时,我们应该能够做得更好。只需不要试图用同样的方法解决所有的问题,就可以避免许多困难。」
Apple在人工智能领域有许多优势,包括全球使用超过20亿台的设备、领先的半导体队伍等。
它们可以支持苹果推广AI产品,并且需要大量的芯片AI任务,包括人脸识别。
苹果能否在一个月内扭转局面?
但是在过去的十年里,苹果从来没有制定过全面的人工智能战略,自推出以来,Siri并没有得到很大的提升。
与此同时,作为语音助手的局限性也削弱了公司智能音响HomePod的吸引力,因为它不能顺利完成一些简单的任务,比如响应歌曲播放要求。
在Siri团队工作了2年后,建立了生成人工智能平台Brighten.ai的John Burkey表示:
「自成立以来,Siri团队一直没有获得与苹果内其他团队同等的关注和资源。
而且苹果的不同部门,通常都是独立的,信息共享有限。
但是事实上,AI需要整合到产品中,才能取得成功。」
另外,苹果在招募和留住领先的人工智能人才方面也有相当大的阻力。
由于苹果的保密性,研究成果很少发表文章,也很少参加会议,这对科学家来说几乎是无法忍受的弊端。
最近几个月,苹果稍微调整了一下一贯的策略,增加了人工智能论文发表的总数。然而,业内研究人员仍然质疑论文的质量,认为这是苹果的营销炒作手段。
但是对于一些初露锋芒、雄心勃勃的研究者来说,加入苹果可以成为项目的领导者,这也是他们选择苹果的重要原因。
尽管苹果已经调整了发展战略,并且吸收了许多新的力量。
但是在这场声势浩大、令人眼花缭乱的AI语音助手之战中,苹果能否在6月份的开发者大会上逆转劣势还不得而知。
未来AI语音助手的形态如何,将如何影响我们的生活?
这一问题的答案不断接近我们。
参考资料:
https://x.com/ai_for_success/status/1789364452640563709
https://www.theverge.com/2024/5/11/24154219/google-i-o-2024-what-to-expect-where-watch-livestream-ai-android-search-gemini
https://www.nytimes.com/2024/05/10/business/apple-siri-ai-chatgpt.html
本文来自微信微信官方账号“新智元”(ID:AI_era),作者:新智元,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com