iPhone16的缺乏背后:国产手机AI能否引领下一次革命?

2024-09-15

就在这个星期二,苹果第一款原生AI手机,终于在千呼万唤中亮相。


使用全新的Apple I 以ntelligence为核心,苹果为iPhone16系列创造了一套完整的AI能力。


不过,看完发布之后 会议内容之后,星海老局的经验却是:就这样?



一如既往的苹果,这次没有意外,没有惊喜,没有重大创新。


简要总结一下iPhone16的变化:


第一,芯片方面,这一次苹果可以算是血本无归,专业版直接在A16跳到A18,Pro版更是做出了A18。 Pro, 采用二代3纳米工艺。



拍照功能再次制作飞蛾:像素升级下的飞蛾 ,增加了一个新按钮,具有组合镜头、视觉智能等特点。,这意味着你可以像一部大电影一样拍照。那个Pro版本也可以拍出电影感的超慢动作。


手表耳机也随之看热闹:Apple Watch Series 10增加了呼吸暂停检查等健康功能,耳机可以降低噪音,airpods目标受众增加了老年人。



总体而言,这些更新,实在是乏善可陈。


近两年来,苹果这个“科技春晚”已经越来越不值钱了,而现在的手机行业,似乎也只剩下一个劲儿卷硬件了。


但是硬件卷到了头,已经成为红海的手机行业,销量依然低迷。


IDC数据显示,2023年全球智能机器出货量同比下降3.2%至11.7亿部,是过去十年中最低的,而苹果虽然在去年市场份额的20%中排名第一,但新机器的激活率却同比下降了-10.6%。


由于同质化和性能过剩问题,许多人认为没有必要经常更换新机器。所以,客户平均需要四年零三个月才能考虑更换新机器。



新兴的AI技术已成为市场上最大的变量,当硬件已卷停时。


假如手机AI的确给人们带来了颠覆性的感觉,那么必然会刺激新一轮的换机浪潮,一潭死水的市场也将盘活。


但是问题是,怎样的手机AI,才是人们需要的好AI。 ?


在AI时代,我们应该使用什么样的手机?


虽然,苹果也在这次发布会上实施了。 了自 手机AI的一系列功能。


可以仔细观察,总是给人一种“锦上添花”的感觉。


AI自动删除照片?咱们自己动手不就行了吗?何必多此一举?


照片可以搜索吗?谷歌多年前就把这个东西整出来了,苹果这是不是刚睡醒?


撰写电子邮件,总结文章?好吧,这不就是ChatGPT早就能做到的吗?


您说,这个功能哪一个能让人眼前一亮?哪一个能让人付钱?



AI功能之一:照片搜索


其实吧, 并非苹果本身的AI能力不好,而是它的技术没有用来解决用户痛点的“刃口”。


在AI时代,“智能”真正的立足之地,不仅仅是用来清除一些照片,或者生成一篇摘要这些花里胡哨的把戏的文章。


它的最大意义, 不可避免地要减少过多、复杂的操作,并更好地理解人类的意图。


那么,这种智能,对手机来说,究竟意味着什么?


它代表着每个人在这个大小之间的玻璃屏幕上, 能避免各种繁琐、复杂的操作,让自己的手和眼睛得到解放。


举个栗子:


就订酒店而言:现在你要开APP对比几家店的价格,还要看评价,选择日期,填写信息,这样会让你筋疲力尽。如果有AI,可以说“给我订个周末去北京的酒店”,可以自动帮你比价,订票,安排行程,一站式服务。多方便啊!


这是一种针对多步、多环节复杂操作的技术,在AI领域有一个特殊的名字,即AI。 Agent技术。



Agent,又称“代理”或“智能体”。AI技术是一种自我规划、决策的技术。


你什么意思?归根结底,它是一个智能程序,可以自己做决定和行为。它不仅能理解你说的话,还能琢磨自己该怎么办,然后自己去做。


对一些复杂的、多步的任务,你只需要说明一个大概的想法,剩下的就全包了。


而且这种技术,国内手机厂商,已经抢先表率。


荣誉在2024年德国柏林消费电子展上推出了行业首个跨应用开放生态AI Agent,它可以帮助用户一键关闭自动续费、一键饮料、一键旅游计划和订票等多项AI。 感觉Agent。


使用者只需一句话就能表明需求,剩下的工作可以由手机自动完成。


比如我们都知道自动扣费是什么东西,对吧?有时候,很明显,一些应用的成员已经很久没有使用了,但是因为忘记取消,这些应用每个月还是会突然扣你一笔钱,很麻烦。



这时候,AI Agent技术便开始发威。您和AI Agent说:"帮助我退掉所有闲置的自动续费会员"。打开APP,搜索相关扣费项目,自动执行整个退订过程。



这个套下来,什么事都给你办好了,比自己用手指一点点利索多了!


而且背后的想法,本质上是让用户直接向手机口述需求,手机自行分解,达到目标,最终呈现结果。


这类AI技术,才是真正能让人省时省力的好东西啊!


开放式VS封闭


事实上,类似的AI Agent 苹果也不是没有技术。例如,在这次发布会上,自动搜索和发送照片是很常见的。Agent技术应该多步操作。



只是在AI时代,苹果有一个难以跨越的门槛,就像荣耀这样的国产厂商一样。


这一门槛,就是苹果多年来一直坚持封闭生态。


如前所述,在AI时代,最省时省力、最能释放大家时间的,就是有自主规划、自主决策能力的人工智能。 Agent 技术。


这种方便又好的技术,每个人都有很大的概率会产生横向扩展的想法。


也就是说, 我们当然不希望这种自动化技术局限于一部手机和一个系统,但我们希望它能在安卓、Windows和物联网系统之间实现协调。


最理想的情况是,之后大家只需要对手机说一句话,就可以一口气完成各种系统和设备之间的复杂操作。


正如贾维斯在《钢铁侠》中所说,AI设备已经成为实现各种操作的终端。



贾维斯在《钢铁侠》中(J.A.R.V.I.S.)可以连接到任意计算机终端。


苹果的封闭生态决定了 ,即便其AI Agent 无论技术多么强大,用户在苹果设备上都可以享受到智能体验, 不能继续到其它平台,导致感觉分离。


更重要的是,在AI时代,有很多新的行业和商业模式。比如自动驾驶、智能家居、AI医疗诊断等。在这些新兴行业,如果能提供全面的解决方案生态系统,很可能会有优势。例如,一个可以连接汽车、智能家居和移动设备的AI助手可能会成为一个新的需求。


因为苹果的封闭生态意味着它可能很难直接进入这些新兴市场。毕竟,你不能强迫每个人都买一个全苹果的设备,对吗?


但是在这方面,基于Android,或者像华为鸿蒙这样开放系统的手机,无疑有更大的优势。


Android设备的增长率明显超过了iOS设备,达到了7.1%,而iOS设备的增长率仅为0.8%,差距接近9倍。



在今年华为 HDC2024 以全新盘古大模型为基础的发布内容 5.0,华为小艺助手升级为小艺智能体。导航、时间表提取、电话拨打、信息搜索等。只需告诉屏幕上的需求就可以轻松实现。


在目前的国内手机厂商中,OPPO和vivo也将在下半年更新自己的AI进度。此前,两家公司相继发布了自己的AI大模型小布和蓝心小V。



对我们的消费者来说,开放的生态,多样化的品牌,意味着更多的选择。


只有在选择充分的前提下,手机上的Agent,或者智能代理,才能更好地理解我们的需求、想法和想法,然后变得更加“理解”我们。


提及选择,构成Agent技术的一个重要环节,语音AI技术,中国用户,现在也有了更多的选择方案。


交互革命


就目前而言,在“人机协同”的道路上,人类与各种智能产品的互动,大致经历了这样几次范式革命:


首先,计算机从最初复杂的代码操作演变到后来的键盘、鼠标。


这样就导致了PC市场的兴起;


第二,手机从原来的按键机,演变成了更智能的触屏机;


在此之后,移动互联网兴起;



同样地, 人工智能时代,人类与各种Agent的互动,也有一种更加高效、方便的方式。


这种方法,就是语音互动。


一项来自斯坦福的研究表明,人类说话的速度是键盘上打字的三倍,甚至是普通人在移动设备上打字的五倍。


所以,完善的语音AI技术,成为高效手机AI的前提。


今年5月14日,OpenAI发布了GPT-4o和端到端实时音视频对话模式,现场演示了AI对话像人类一样流畅。它可以感受到你的呼吸节奏,用比以前更丰富的语气即时回复,甚至随时打断AI,效果惊人。


演示一出,大家纷纷惊呼,这不就是现实版吗?《Her》吗?



可以万众期待,它正式上线的日子,也一拖再拖,以致成为行业内的“期货”。


而且,细心的网友也从演示的视频中发现了猫腻。


事实上,发布会现场演示了手机,但插上了网线。


也就是说,在现实环境中,演示中所展示的实时互动效果,实现起来可能并不那么容易…



但是,在OpenAI哑火的同时,国内AI厂商在语音AI赛道上百花齐放,各种可以实时互动的国产语音AI实际上已经落地。


例如,讯飞版于今年八月底。「Her」全体员工的感受已经开放,他们有快速响应和自由中断的互动能力,让人机交换更加自然流畅。与GPT-4o相比,它不会让步太多。



与此同时,它还能准确地识别用户的情绪状态,并以适当的语气回应,在情商方面秒杀不少人。


AI对话音频

其背后的核心技术是讯飞开发的多维语音特性解耦表征训练方法,能更好地控制语音的每一个特性。


同样,8月底,火山发动机发布了全新的豆包大模型升级版。新版本还结合了RTC实时音频和视频技术,完成了用户与AI的自然对话。用户可以随时打断和打断,整体对话质量不会受到影响。



而且作为我国AI领袖之一的智谱清言,几乎在同一时期,发布了自己的实时语音AI。



就视频理解而言,基于GLM-4V-Plus的语音AI,可以很容易地理解复杂的视频内容,并回答用户提出的问题。


如果玩《黑神话:悟空》的时候,玩家遇到了一个看不懂的佛经,AI可以帮助玩家通过拿起手机和视频聊天来破解佛经。


AI视频聊天

可以说, 这一功能是真实的,落地快的国产语音AI,为今后国产手机AI的进一步崛起提供了足够的“弹药”。


结语


说到手机AI的赛道,中国和美国其实还在同一起跑线上。 ,谁也没有甩掉谁多远。


这种竞争格局,虽然我们中国还没有像苹果那样在软硬件一体化方面取得强大的“巨无霸”,但在这个AI的江湖中,我们中国公司却处于各种垂直行业,比如AI。 Agent、AI语音在这方面构成了局部优势。


这种局部优势,与中国庞大的移动用户群体相结合,将成为未来AI时代国产手机品牌逆袭的资本。


而且这种反击一旦完成, 大量广泛分布的手机AI,可能会形成一种“农村包围城市”的云大模型趋势。



在这种情况下,手机上的小型终端模型很可能会占据到处都是透水性高的生活场景(相当于“农村”),比如拍照、打车、购物、办公等等。


而且云模型(例如ChatGPT和Claude) 3.5),将占据更集中、更通用、对算率要求更高的场景(相当于“城市”),如总结、分析长文档、长视频等任务。


如此一来, 在AI时代,中国企业也有可能与美国巨头分庭作战。


本文来自微信微信官方账号“星海情报局”(ID:作者:星海老局,36氪经授权发布,junwu2333)。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com