谷歌:Android 电话,听我的,AI 要这样做
抢先苹果一个月,Google 将 AI 移动电话的概率,都显示在自己身上。 Pixel 新机当中。
当地时间 8 月 13 日,Google 发布了 Pixel 9、Pixel 9 Pro 还有二代折叠屏 Pixel 9 Fold、新的硬件产品,如智能手表,耳机。与硬件相比,人们更加关注, AI 如此火爆的当下手机, Android 系统管理者,Google 将如何将端侧面转移 AI 用于 Android 手机当中。
大约十个月前,谷歌推出了第一代。 AI 移动电话,现在不到一年,这个巨头又更新了。 Gemini、Android 和 Pixel 产品组合,这次,主要关注的是产品组合,「有一些竞争者,我也有」方式。
自 OpenAI 推出 ChatGPT 声音模式,以及下一代苹果 iPhone 的 AI 到目前为止,同行们能做到的,谷歌都不愿意掉队,包括 AI 语音对话,搜索屏幕截图中的信息等。同时,谷歌也在让步 AI 进一步整合到自己的应用生态中。
谁才是 AI 移动电话领袖,Google 一定要和苹果掰手腕。
回应 OpenAI,
Gemini Live上线
Gemini 是谷歌各种 AI 商品的基石,也是谷歌 Pixel 9 默认助手在系列手机上,Gemini 整合到手机中有哪些升级,是发布会上的一大焦点。
谷歌 Pixel 手机上的 Gemini 按下电源按钮即可唤出。根据谷歌高管的说法,从今天开始,用户可以在使用的应用程序上方调出。 Gemini 覆盖层,询问相关屏幕内容的问题。例如,顾客可以询问他们在看什么。 YouTube 与视频有关的问题,用户也可以直接进行。 Gemini 覆盖层产生图像,并将其拖放至 Gmail 和 Google Messages 等待应用程序。
谷歌也计划好了「未来几周」让 Gemini 将更多的应用程序连接起来,包括日历, Keep 和 YouTube Music 等。特定的功能用途如, Gemini「制作一份让我想起 90 音乐列表在时代末期。」「拍下演唱会传单的照片,让他们 Gemini 检查当天是否有空-甚至设置提醒购买门票。」「让 Gemini 在你的 Gmail 在中间找到一个食谱,并要求将调料添加到中间。 Keep 里面的采购清单。」
除这些集成体验外,谷歌也正式上线。 Gemini Live,这个功能可以算是谷歌对谷歌。 OpenAI 推出的 GPT-4o 先进语音模式的回复。此功能以前在谷歌。 2024 年 I/O 在开发者大会上曝光,今日正式启动。
顾客可使用手机和谷歌的生成AI聊天机器人 Gemini 进行语音对话,可以半途而废,提出跟进问题,对话可以随时暂停和恢复。包括一些具体用途的例子,让 Gemini Live 陪你准备工作面试,练习演讲,随便聊聊自己关心的话题等等。

那么,Gemini Live 相较于 ChatGPT 语音模式是否有优势?
据悉,支持 Live 的生成式 AI 模型架构——Gemini 1.5 Pro 还有Gemini 1.5 Flash,拥有比平均水平更长的东西「前后文窗口」,这意味着他们可以在生成响应之前处理和推理大量的数据,理论上他们可以进行近几个小时的对话。
Gemini Live 也可以免提使用,用户在使用后台或手机锁定时可以继续进行语音对话,10。 可以选择新的声音。
但是值得注意的是,Gemini Live 现在还没有上线「多模态输入」功能,据报道将于「今年的晚点期」推出。
几个月前,谷歌发布了一段预录视频,展示了 Gemini Live 如何通过手机镜头捕捉到的照片和视频识别客户周围的环境并做出反应,比如指出损坏自行车的某个部件,或者解释电脑屏幕上代码的功能,这些都没有得到现场的真实演示。
并且,Gemini Live 在 Android 手机上的 Gemini Advanced 在用户中推出订阅并不是免费的。现在它只提供英文版,谷歌说「未来几周」通过应用程序扩展到更多的语言,并扩展到更多的语言 iOS。
谷歌 Gemini 在谷歌助手方面体验高管称。「谷歌正处于探索AI驱动助手各种有用方法的初始阶段——就像 Pixel 手机一样,Gemini 会越来越好。」
另外,关于隐私问题,谷歌 Android 在生态系统方面,高管表示,Gemini 在处理用户信息时,支持数十家设备制造商的数百款手机型号,数据不会离开手机。
「Gemini 可根据您的私人教练电子邮件协助建立日常锻炼计划,或使用您的电子邮件 Google Drive 简历撰写工作简介。只有 Gemini 这一切都可以通过这种安全、一体化的方式来实现,而不需要将数据交给第三方AI提供商,这些提供商可能不知道或信任。」谷歌 Android 生态系统总裁 Sameer Samat 称。
「因为 Android 是第一个拥有大型设备的多模态设备。 AI 模型化移动操作系统-名称 Gemini Nano——当你处理一些最敏感的用例时,你的数据不会离开你的手机。」
AI 进一步融合进行 Android
谷歌推广 AI 移动电话的最大优点无疑是自己的多种软件工具, Android 目前,谷歌拥有数十亿生态 Android 顾客,可以发挥的空间,显然比聊天机器人应用要多。
作为去年的第一款 AI 谷歌的核心智能手机 Pixel 8 系列带来了各种各样的东西 AI 功能。例如,用户可以移除、移动或编辑照片上的单个元素,并在照片之间移动表情以获得最佳合成照片,并可以基于截图或屏幕上的一个。「圈选部分」搜索等等。
所有这些功能首次出现 Pixel 8 在系列之后,整个系列 Android 在一定程度上推广了生态系统。
像谷歌的「圈选搜索」功能,实际上第一次出现在三星。 Galaxy 作为谷歌的AI手机 Android 三星的手机还增加了许多类似的AI功能,生态合作伙伴。上述 AI 助手 Gemini 还出现在三星 Galaxy Z Fold6、摩托罗拉 Razr 等手机里。
同时,其他厂商也宣布将推出自己的手机。 AI,在过去的几个月里,最受关注的是苹果,同样的方向和想法是结合自己的应用生态。
差不多一年的时间,「AI 手机」可以说,它已经成为市场对手机的核心视角,而不仅仅是谷歌手机。如何用AI让人眼前一亮,对谷歌来说是一个挑战。目前,与第一代AI手机Pixel相比, 8点类似,谷歌导出最多的还是各种 AI 小功能工具。
在今年 Made By Google 在活动中,谷歌推出的AI新功能包括:
「Add Me」,即使是拍照的人也可以把自己拍进照片里;
「Pixel Studio 」,AI图像生成器,以及即将推出的苹果Image。 Playground的应用非常相似;
「Pixel Screenshots」,在客户图库中扫描截图,并将其转换为易于搜索的数据库;
「Call Notes」,通话记录中的信息摘要可以保存,通话中的每个人在激活该功能后都会收到通知。
在这些情况下,如果要实现「Add Me」功能方面,摄像师先拍一张没有自己的照片,然后另一个人当摄像师,再拍一张照片。Pixel 将两张照片合并,确保每个人都在一张照片中,不需要找陌生人帮忙拍照。
谷歌给 Pixel 9 AI相机是系列定位的主要卖点,自封为「世界第一个 AI 驱动的相机」。谷歌高管也表示「Pixel 这是第一款将夜视功能应用于照片和视频的手机,现在也是第一款在低光环境下拍摄壮丽全景和城市景观的手机。」谷歌高管也将在新闻发布会上 Pixel 9 Pro XL 与苹果拍摄的照片 iPhone 15 Pro Max 进行比较。

谷歌手机 vs 晚上苹果手机拍照效果效果效果|来源:谷歌
超大屏幕折叠模型 Pixel 9 Pro Fold 还有一个「Made You Look」功能可以用来吸引用户的注意力,让他们对着镜头微笑。使用这个功能时,手机会在外屏上播放引人注目的视觉动画,比如一只亮黄色的鸡或者其他搞笑的动画。
拍完照片后,还有修图工具,谷歌图片。 Magic Editor 这一年又推出了一些新功能。例如 「Auto Frame」用于校准倾斜照片的视角,共同使用生成式AI来填补主体周围的空白,形成更广阔的视野。还有「Reimagine」功能,在输入框中描述想要的效果,可以使用生成式 AI 来 P 图片,例如把地上的草变成野花,在天空的某一部分加热气球等等。
另外,谷歌紧跟苹果的步伐,在紧急情况下推出一种使用方法。「卫星 SOS」该功能使用户能够联系紧急救援人员,共享位置信息,而无需蜂窝服务。根据谷歌高管的说法,Pixel 9 系列将是「第一批可以使用卫星 SOS 的 Android 手机。」
就功能而言,Pixel 9 Gemini 搭配,不在 AI 目前国内Android领先国内 制造商太多了。但是需要注意的是,与苹果不同,Google 既有自己的系统和终端,又有大模型和云计算,是目前所有企业中的一个。「软硬芯云」真正完成闭环的企业。
一旦终端 AI 出现突破口,万事俱备。 Google 「再次杰出」与竞争者相比,概率要大得多。
或许,Google 缺少的,只是一种更大的欲望。
本文来自微信微信官方账号“极客公园”(ID:geekpark),作者:核心,编辑:靖宇,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




