谷歌版Her大翻车:试了三次,换了手机才成功…网友:我手动只需要10秒。
翻车,大翻车。
今天早晨,谷歌版Her——Gemini Live正式发布。
归根结底,与OpenAI家族相比,GPT-4o显然是吸引了科技界的目光。
网站上发布的demo,拍照问答其功能效果如下:
这个功能大致实现了,就是用手机拍摄音乐会的海报,让Gemini查看用户的日历,看看行程是否适合参加。
并且还可以基于此进行一系列的后续操作,包括定时查票价等等。
但是...当我来到新闻发布会现场演示时,画风是180。°大变样。
第一次:失败。
第2次:失败。
第3次:更换手机,成功。
嗯...小哥哥的表情,肉眼可见有点慌张。
即使是著名的科技媒体TechCrunch也与这种emoji相匹配。:
甚至有网友开启了辣评方式:
我可以在10秒内搜索我的日历。
当然,这只是今天的Made by Google的一集。
关于Gemini 我们继续往下看Live的更多内容。
Her全貌谷歌版
正如我们刚才所说,Gemini Live和GPT-4o的功能非常相似。
除“拍照问答”外,它还能实现即时对话,甚至在Gemini回复过程中中断。
据悉,目前Geminini 在安卓系统中,Live的功能已向Advanced订阅者开放(仅限英文)。
在接下来的几个星期里,这一功能将陆续扩展到更多的语言,并向iOS开放。
在对话声音方面,Gemini Live推出了10种选择新的声音;
在操作另一方面,由于Gemini已经完全集成到系统中,所以只需按下电源按钮或说“Hey Google",可以调用。
例如,在写邮件的过程中,让Gemini帮助您生成图片,效果如下:
但对这一功能,外媒的评价却是褒贬不一。
比如The 一位作者在Verge中亲测之后给出的标题是——
Gemini Live比Google快,但是更加尴尬。
其主要原因是作者在一次为期三天的高速公路旅行中,车辆的音频系统突然失效。
Gemininini用原来的谷歌助手至少花了五分钟才找到解决方案。 Live只需要15秒。
但是在对话过程中,Gemini Live的不断发言和需要用户主动打断的交互技术,让作者感到尴尬。
他认为:
声音和说话方式过于个性化,以至于在中断时感到不舒服。
和Gemini一起 Live在互动中倾注了更多的情感,而不是把它作为解决问题的工具。
巧合的是,对于Gemini来说 Live在云端运行这一点,华尔街日报也给出了犀利的评价。——
谈话的进步,功能的退步。

具体到技术层面,GPT-4o是一个端到端的系统,但是根据谷歌发布的内容,Gemini Live不是这样。
取而代之的是STT、VAD、集成了LLM和TTS系统:
此外,Gemininini也出现在谷歌发布的新Pixel系列手机中。 Live的身影。
包含Pixel 9 Pro Fold、Pixel 9、Pixel 9 Pro和Pixel 9 Pro XL。
在AI功能方面,谷歌的Pixel手机在拍照上增加了一个名字叫做Pixel。“Add Me”的功能。
增强现实是可以使用的(AR)与AI技术相比,可将两张不同照片上的人物“塞”在一起。

为什么谷歌追不上OpenAI?
虽然谷歌这次发布了Geminini。 Live,这是OpenAI GPT-4o是一场迎战,但是自从大模型时代开始以来,我们可以看到一个非常明显的趋势。——
谷歌,跟不上OpenAI的步伐。
第一,OpenAI已经成为ChatGPT发布最关键的节点的开拓者,但是谷歌随后发布的Bard,以及这次Gemini。 Live非常相似,随后出现了翻车情况。
接下来的一年半多时间,似乎所有重磅模型、重磅应用的发布,都是OpenAI引领的。
另一方面,谷歌不仅在技术上表现出缓慢的状态;甚至在舆论上,谷歌年度最大活动也被OpenAI用人事调整(Ilya辞职)的消息覆盖。(I/O大会)热度状况。
那为什么谷歌在模型时代不行呢?
对此,前谷歌CEOEric Schmidt(从2001年到2011年)他在斯坦福的最新演讲中表达了自己的观点:
谷歌非常重视工作和生活的平衡,例如允许员工在家工作。
但是创业公司,他们的工作真的很辛苦。
而且有网友爆料称:
作为谷歌顶级AI程序员,我兄弟有三份全职工作,每天只在谷歌工作两个小时。

所以你觉得这个怎么样,欢迎在评论区留言讨论。
参考链接:
[1]https://x.com/techcrunch/status/1823410187404743131?s=46&t=6eepxw1G6XRQ7VO0JWGG
[2]https://x.com/GoogleDeepMind/status/1823409674739437915
[3]https://blog.google/products/gemini/made-by-google-gemini-ai-updates/
[4]https://x.com/alexkehr/status/1823480786349383879?s=46&t=6eepxw1G6XRQ7VO0JWGG
[5]https://www.theverge.com/2024/8/13/24219736/gemini-live-hands-on-pixel-event
[6]https://blog.google/products/pixel/google-pixel-9-new-ai-features/#pixel9phones
本文来自微信微信官方账号“量子位”(ID:QbitAI),作者:金磊,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




