蔚小理的智驾,学不起。

08-13 22:41

从来没有一个 7 月亮的空气就像今年一样紧张和焦虑。


7 月亮是蔚小理性驾驶赛程的关键赛点。正如提前商量一样,上个月,蔚小理陆续开了新闻发布会,集中火力开火。


7 月 5 日本,理想的夏季智驾发布会,将自己的关键技术全部托出,有一种掏凉粉自证端到端快速进步的紧张感。


7 月 27 日,蔚来开了一年一度的日子。 NIO IN,蔚来世界模型 NWM 成了重头戏。蔚来在这次发布会上提到了很多闻所未闻的新词,空间认知,时间认知,GOA、群体智能,蔚来似乎希望为这场端到端的竞争增添一些新的质感。


7 月 30 日本,小鹏压轴登场,却成了三者中最低调的一个。


在小鹏智驾 AI 在技术发布日,小鹏在出场前在微博上透露,当天的活动资料被团队合作伙伴删除了三、四页,团队但愿小鹏不要说得太早。


结果,8 月 2 华为率先公开,已实现车位智能驾驶。小鹏自动驾驶产品经理袁婷婷说,小鹏当晚没有正式宣布就忍住了。「从车位到车位的端到端智驾驶」,原因是担心过于激进。


另一方面,小鹏的谨慎和冷静似乎也显示出作为头部智驾厂商的信心。


另外一方面,可以确定,随着新力量切入端到端,智驾竞争进入了一种只争分毫的焦虑状态。


小鹏以 AI 决定论,注重磨刀不误砍柴工,理想情况下学习华为继续在智能驾驶中进行压力投资,寻找突破口,而蔚来不慌不忙,换刀注重自动驾驶质感。


它们各有特色,但也咬得很紧。


一种新的竞争形式,正在完全打开。假设过去几年的竞争是 720P 画面质量的竞争,只看技术轮廓的竞争,那么下一步就是技术轮廓的竞争, 4K 画面质量的竞争,不仅要争夺框架,更要经得起顾客拿着放大镜看细节,考察的是「知识的缝隙」,细微的差别变得更加重要。


一家自动驾驶公司的创始人这样描述:「今年的底线是无图,明年的底线是端到端量产。」,足以表现出自动驾驶战场的焦虑。


如今,崩溃的不是智驾能用还是不能用,一般都是好用还是不好用。


01 理想:从差生到绝对第一梯队


在过去的几年里,由于进展缓慢,理想智驾被排除在各种智驾名单之外。


在此之前,理想的重点并没有放在智能驾驶上,但是去年雁栖湖战略会话结束后,一切都变了,自动驾驶成了理想的重要战略之一。


在内部,理想的自动驾驶经历了泰坦计划、金苹果计划、达摩克里斯计划三场战争。


三个重要节点对应理想智驾:


2023 年 12 月推送理想 AD Max 5.0 百城智驾版本开启;


2024 年 7 月推送 AD Max 6.0 全国无图智驾版;


2024 年底将量产端到端智驾;


去年 10 月亮,我们试驾的理想 L8,当时开城如火如荼,阿维塔、问界、极越等车型已经开通了城市智能驾驶。只有理想和极氪还没有开通城市智能驾驶,理想的销售只能带我们去一条快速公路试驾。


直到理想 AD Max 5.0 版本推出后,才逐渐覆盖全国 110 一条城市的主干道。


真正的理想分离并非如此 5.0 到 6.0 版本,而是 6.0 飓风式的到端到端弹跳。


最近半个月,我们先后试驾理想。 AD Max 6.0、端到端内测版,差别非常明显-端到端与端 6.0 根本不在一条水平线上。


6.0 游戏性、拟人性、智力水平都远不及理想端到端。



举两个例子,同样是二轮车,6.0 版本跟在二轮车后面一分钟左右不敢超车,而端到端版本非常果断超车;在可用性方面,6.0 当遇到深圳施工路段有自动退出的情况,而端到端即使来到乡间小路也可以实测开启。


理想的智驾更像是一名学困生在高考上半年决心奋起直追。


与其它汽车公司不同,理想官方将其端到端描述为「One Model」端到端


为说明其技术路径,7 月 5 理想智能驾驶夏季发布会改变了平时新力量现场发布的风格,拉着理想智能驾驶全线负责人进行深入采访。前半段介绍无图智能驾驶。 6.0 版本,下半场由贾鹏、郎咸朋详细讲解理想端到端。


理想的端到端有四个亮点:一般障碍物的理解能力、超视距导航能力、道路结构理解能力和拟人化规划能力。这四种能力对应底层。 系统 1 端到端模型 系统 2VLM 模型


理想的双系统结构来源于丹尼尔·卡尼曼的《思考,快与慢》, 1 到目前为止,代表直觉和本能的快速系统,从端到端处理 95% 路况,系统 2 也就是有目的地分析思考的慢系统, VLM 处理剩下的 5%。


端到端模型的理想优点是数据、训练方法和模仿用于学习行驶轨迹。


资料:理想约有 200 亿公里 驾驶数据,并根据自定义的驾驶标准选择驾驶标准 100 一万公里,年底 500 训练使用万公里的模型数据;


训练方法: 模仿学习 强化学习 ;端到端的主要目的是模仿真实的驾驶数据来学习驾驶轨迹。然而,由于驾驶轨迹不能判断驾驶行为是好是坏,为了防止奇怪的驾驶行为,强化学习融合在一起,使系统知道什么是错的,从而惩罚系统。加强学习有助于端到端拥有复杂环境的能力。


系统 1 和系统 2 的互补:22 十亿参数 VLM 大型模型布局在这里 OrinX 在芯片上,当遇到复杂的场景时,系统 2 能结合知识推理给出更好的判断。举例来说,识别潮汐车道,遇到坑洼车道给出降速建议。


这是一个难题,理想, 怎样把 22 数百亿的巨大参数布置在几百个 TOPS 上的 OrinX ,也达到了低延迟?


贾医生解释了这一问题,原始 VLM 最初有 4.1s 延迟,可缩短到最后。 0.3s 延迟 ,它需要四个步骤:


第一步: 增强了 LMM GPTQ ,采用传统的量化方法 AWQ,理想魔改了 GPTQ,处理内存带宽不足的问题,延迟减少 1.9s。


第二步: 增加 VIT 算法结合 ,完成了 Tensor (张量) 算法结合,对 attention 进一步完善算法,将延迟降至 1.4s。


第三步: 增加 LMM 投机取样 ,理想的自研投机采样方法只能从每次推理中输出一种。 token 然后继续输入多个 Token,延迟减少至 0.7s。


第四步: 增加流式视频编码器 ,在重复视觉计算阶段使用带宽压力,最终延迟到可接受的阶段。 0.3s。


准确地说,理想并非只有双系统,从端到端+VLM 除模型系统外, 理想仍然存在第一 3 一个系统-世界模型


这个系统就是理想 1、系统 2 建立考试体系。3D 虚拟化环境一目了然,效率低下,重建式仿真容易发生车辆拖影行为,而生成式则存在不符合现实世界规律的幻觉问题。


因此,理想将重建模拟和生成模拟结合起来。「世界模型」,利用扩散模型重建现实世界,对整体进行改版,将试题做成新的视角。 3D 物理学世界,使用 3D 高斯溅射可以作为生成模型,进行模拟题,使其具有更好的泛化性,可以控制天气、交通流量甚至时间。


理想在 7 在这个月的竞争中,给料最多,在一定程度上也是对大众发言: 理想不怕竞争


其中一个细节就是,李想常常会问郎咸朋算率是否足够,不够就让谢炎弄点。


理想的智驾自信在于,理想真的不愁卖。现在理想的现金储备接近 1000 亿元,24 万智驾客户正呀呀学语。


现在,理想已经倾注到端到端。 10 亿人民币 ,将来还打算 投 10 亿美元。


朗咸朋认为,「先不说 想要支持的L3/L4 VLM 以及端到端的训练,大概需要 几十 EFLOPS 云端算率。」


02 不要把端到端看作解药的蔚来,慢吗?


「蔚来智驾至少比理想慢两代。」,一个微博大 V 博主在 7 蔚来月底曾经这样评论过。


蔚来真的很慢吗?


7 月 27 日,蔚来 NIO IN 关键也是智能驾驶,蔚来智能驾驶研发副总裁任少卿花了半个小时介绍。 蔚来世界模型 NWN


不像理想把考试系统称为世界模型,蔚来把自己的整套智能驾驶方法理论称为世界模型。


2024 2008年上半年是蔚来城区智驾使力时期, 月底,蔚来推动了包括城市在内的城市地区 NOA 全球领航协助 NOP ,遍布全国 726 这座城市,下一个节点将到达蔚来 Banyan2.6.5 ,这个版本包括端到端 AEB 功能,目前蔚来还没有正式宣布端到端。 OTA 时间节点。


我们上个月试驾了 Banyan2.6.5 版本在面对复杂的十字路口和穿越行人时仍然需要接管,但好的一点是,蔚来的计划基本符合人类司机的预测范围,不会像其他智能驾驶那样有太多超出人类无法理解的决定。一般可以用,但是用起来还是有一定差距的。


经过上半年的调整,蔚来为端到端作出了团队挑战和理想的基本前后脚,蔚来的R&D团队分为感知、规范和整合部门。


经过调整,感知和控制变成了一个大模型团队,集成了一个交付团队。


然后就是在那里 NIO IN 的一系列「成果」的发布,在 NIO IN 在现场,可以看到蔚来的风格就像一个绅士,列出了数字,但是没有说谁是第一,提到了端到端,但是没有拉踩和比较。


蔚来正试图抛开使用理工科男性的技术框架, 技术故事用文科生的语言讲述。


蔚来的世界模型 NWM 这是一套利用想象力重建进行空间认知,想象力推演进行时间认知,「多样性,自回归生成式」模型结构。


说白了,就是左脑首先要获得更多接近现实世界的信息,右脑要继续生成更长的信息。


从信息提取的角度来看,任少卿认为蔚来自动驾驶想象重建的能力已经经历了四个阶段:


第一阶段:2010-2020 年 2D/3D 检验,用框架和线条描述现实世界,信息量不大;


第二阶段:2021-2022 年 BEV 该算法提取了更多信息,但缺乏路边信息;


第三阶段:2022-2023 年 OCC,2D 信息化的表达变成了 3D,但缺少物体材料、天气特性等;


第四阶段:2024 2000年后,蔚来世界模型学习真实视频后,利用想象力重构生成与现实世界基本一致的平行时空。


就想像推演的能力而言,蔚来依赖于 NWM 可以生成了 2 长视频生成分钟,超过了大多数视频生成软件。


有一个很有意思的案例,给蔚来世界模型一个真实的视频,让模型回到事故发生前。 3 秒,此时,世界模型将在平行时空中做出多种决定,如突然刹车、右转等。


每 0.1 秒生成 216 一个可能的平行轨迹 ,评估后选择最优解。


老实说,蔚来的这款游戏比较奇特,在大家都说端到端的时候,不再刻意去提端到端,颇有种类。「你们打你们,我打我」作风—— 不要再陷入别人的话语体系去战斗。


甚至,蔚来最终还是在发布会上做了一张图片。「空间理解,时间理解,使用海量数据」将常规端到端模型与蔚来世界模型的区别进行比较。


若要考虑蔚来的数据支持,蔚来的智驾云终于有力了。 287.1 EOPS、智驾客户 53 万、智能驾驶城市累计验证总里程已达到 3.7 全球领航协助1亿公里。 NOP 可以使用路面总里程 389.9 万公里。


蔚来的野心需要支撑,而这些支点似乎是群体智能,生成模拟, 事实上,蔚来希望在自动驾驶比赛中使用符合品牌调性的话语系统独树一帜。


你和李斌谈论专利和数据,但李斌会提到蔚来的愿景是创造一种不同的蔚来社区文化,从技术、商品、服务和社区四个维度来看公司的长期竞争力。


李斌认为,蔚来已经做好了充分的心理准备,每季度投入。 30 一亿元的研发费用,一年投入一百多亿元的研发费用,让蔚来有机会参加智能决赛。


03 小鹏磨刀,磨刀不误砍柴工


在某种程度上,小鹏和李斌的许多想法尤其相似。


同样强调技术底色,强调要按照建造100层楼的标准打桩。


现在和其他两个家庭一样,小鹏最近也完成了对端到端的组织结构调整,技术开发部门被拆分成三个部门,分别是 AI 端到端、AI 应用、AI 能效


不同的是,小鹏是唯一一家在新力量上被贴上智驾标签的汽车公司。


好处是随着智能驾驶的增加,只要小鹏保持竞争优势,销量就会增加。缺点是智能驾驶不会是市场对智能驾驶的认可时的显性优势。


被贴上智驾标签的小鹏,在实际表现上并不令人失望。


在我们所做的智能驾驶实测中,小鹏是目前所有拥有智能驾驶的车型之一。 唯一能拐的人 U 型弯的 ,而且包括华为在内的其它智开车对于这种情况还是无能为力。


与其它新力量智驾发布会不同,急于秀肌肉, 7 月 30 在智能驾驶的新闻发布会上,面对焦虑的行业,可能会变得谨慎,也可能是作为三好学生的一种警惕。小鹏没有仔细扩展他的量产端到端智能驾驶模型架。 构(神经网络) XNet 规控大模型 XPlanner 大语言模型 XBrain) ,而更有地气,围绕小鹏 XNGP 智能驾驶更换,智能驾驶产品功能进行。


小鹏 XNGP 分为 四个阶段


第一阶段/第二阶段可以在全国范围内开启——第一阶段/第二阶段可以在全国范围内使用。


如果没有意外的话,小鹏的第三部曲很可能是「全球都能开」。


当晚, 天玑被小鹏释放 XOS5.2.0 版本 ,其 XNGP 能在全国范围内实现使用,1000 大米循环倒车,离车停车 2.0。


相当于小鹏正式宣布,小鹏已经进入了全国使用的第一阶段,可以支持所有城市和公共道路,甚至可以打开环岛/掉头/施工场景。


接下来的第四季度,小鹏将进入全国易用第二阶段,开辟公园内部道路和高速/城市 ETC、还有行车. 停车停车闸机。


对何小鹏来说,「好用」的标准是 不限城市,不限路线,不限路况 。从顾客的角度来看,小鹏希望到 2025 让用户可以在年内服从「好用」谈到爱用智驾,衡量的标准是感觉更流畅,智驾更有效率,根本不需要接管。


换言之,就是让所有曾经有过智驾断点的地方都连接起来,智驾无阻。


看完蔚来和理想的新闻发布会,你会觉得蔚来和理想是向同行展示肌肉,面向行业媒体和智能驾驶工程师。然而,小鹏更关心如何让智能驾驶技术变得更好。 C 终端用户可以理解,可以使用。


一条非常有趣的信息是,小鹏讲述了小鹏为了让全国真正开放,开放更安全, XNGP 走遍了全国 2595 这座城市,做了 756 万公里 实车测试。


一位小鹏用户反馈自己的用户。 5.2.0 由新疆开到北京,真的做到了全程都可以开。


近半年来,小鹏的销量一直略显疲软,有大量的销量。 V 为 2024 年度上半年销售划清界限:


累计销售额超过半年 18 万的第一集团军:理想,问界。


累计销售额超过半年 8 万的第二集团军: 极氪和蔚来,零跑和深蓝。


累计销售额超过半年 6 万的第三集团: 小鹏,哪吒,腾势。


但做 AI 回旋镖,一定会飞到小鹏手中。


为何如此坚定?或许是从何小鹏最近两周的美国之旅转变而来。


第一,何小鹏在美国看到了对自动驾驶的信心。 。小鹏在美国的两个星期里一直在经历。 Waymo 和特斯拉,还有 Waymo 使他看到了小鹏努力的方向,他对汽车的心表示,小鹏 Max 智驾的版本要对标 Waymo 的水平。


换言之,一个人平均一天开始。 70 只有接管公里 1、2 次水平。


就技术而言,将这种体验从装满激光雷达的运营车辆下放到个人乘用车是一个巨大的挑战,但何小鹏认为, 18 个月 (2025 年末) 足以做到。


第二,何小鹏看到了汽车工业的未来。



目前,中国汽车工业的趋势是唯一的销售理论,但小鹏已经摆脱了这个想法。其他人在新闻发布会上谈论技术。他们的新闻发布会从一张技术图开始,上面写着「 上一代风口是新能源/云服务,下一代是新能源/云服务。 AI。


许多自动驾驶公司的创始人与小鹏有着相同的看法,他们认为,AI 这是一个参与各行各业的变革和机遇,远比新能源和云服务激烈。看到这种趋势,小鹏也有信心和冷静。


AI 就是小鹏的战斗号角。李力耕提到,在小鹏内部,不仅仅是端到端的拥抱。 AI,甚至小鹏的整个工作过程都在拥抱智驾,「首先,我们敲代码的老师是 AI」。


如果从 L1—L5 就自动驾驶分级系统而言,智能驾驶道路是一个漫长的赛跑。小鹏的特别之处在于,其他新力量可能只是想把它放在一边。 L2 干出来, 但是小鹏还是想把它放在一边 L4 与特斯拉一起干燥,Waymo 同场竞争


三年前,新力量刚刚突破生死线。他们的工具是新能源和智能硬件。然而,从更长的维度来看,新力量在软件上竞争了很长时间,但三年后就变得更加激烈了。


小鹏每年在 AI 上投入超出 35 亿,理想去年投资智驾。 10 亿,下一步还要再投 70 亿,蔚来正在研究和开发 100 一亿元的预算,每个家庭都充满了军火。


但归根结底,人力、资金甚至技术结构都没那么难学。核心是,当智能驾驶没有大规模推动销售时,这群新力量仍然坚持智能驾驶是产生下一个增长神话的底层信念,这是最难学习的领域。


本文来自微信微信官方账号“汽车之心”,作者:白雪,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com