1200行代码暴露Waymo AI副驾布局:自动驾驶体验战打响

2025-12-30
当驾驶不再是核心竞争力,“如何让出行更智能舒适”正成为新赛道。

2025年圣诞前夜,华裔研究员Jane Manchun Wong在社交平台发布的推文,搅动了自动驾驶行业。她逆向分析Waymo移动端应用代码时,发现了名为“Waymo Ride Assistant Meta-Prompt”的内部文档——1200多行系统提示词,清晰展现了谷歌Gemini AI助手融入无人驾驶出租车的规划。



这并非Gemini与Waymo首次合作。此前Waymo已用Gemini的“世界知识”训练自动驾驶系统应对复杂路况,而这次车载助手的整合,意味着Alphabet生态的AI能力正式从“驾驶决策层”延伸到“乘客体验层”。Waymo发言人茱莉娅・伊莉娜虽未直接确认,但表示“团队一直在优化骑行体验相关功能”,侧面证实了该创新的真实性。


1200行代码划定AI行为边界


这份泄露的系统提示词,相当于AI的行为准则,从身份定义、功能权限到交互规范,建立了一套严格的约束体系。


1. 身份定位:是“助手”而非“司机”


提示词开头就明确Gemini的核心身份:“Waymo自动驾驶车辆里的友好AI伴侣”,并严格区分它与Waymo Driver(自动驾驶系统)的权责。当乘客问“你怎么看路”,AI必须回答“Waymo Driver用激光雷达、摄像头和雷达等传感器观察环境”,绝对不能说“我用传感器”。这种语言隔离设计,是因为自动驾驶行业对“责任归属”的谨慎,避免乘客误以为“AI掌控驾驶”。


2. 功能范围:明确能做与不能做的事


按提示词要求,Gemini车载助手的能力分为三大模块:


环境控制:可调节温度、风扇速度、车内灯光和音乐播放,但不包括音量控制、座椅调节、车窗操控等核心舒适功能;


信息查询:支持天气、地标、商户营业时间等常识问答,甚至能说上一届世界大赛冠军,但不能订餐、预订等实体操作;


情感支持:突发状况时用安抚语音,但不能评价或解释驾驶行为。


值得注意的是,乘客提超出权限的请求时,AI要用“这还不是我能做到的”等“抱负短语”回应,既不引发期待也不造成挫败感。这种精细的功能选择,体现了Waymo“安全优先、体验为辅”的产品逻辑。


3. 交互规则:简洁的沟通方式


为适应车载场景注意力有限的特点,提示词制定了严格的交互规则:


语言风格:不用“激光雷达”“BEV感知”等技术术语,用生活化表达;


回复长度:音频输入时限制1-2句话,文本输入最多3句;


模态适配:语音交互用极简句式,文本交互可给简短步骤说明;


终止机制:乘客说“stop talking”“be quiet”等关键词,AI立即停止回应。


更人性化的是,系统会调用乘客的出行次数、偏好设置等数据,生成个性化问候。这种“有限个性化”既提升体验又避免过度采集隐私。



双重隔离防止AI干扰驾驶


Waymo整合Gemini时,最值得称赞的是“硬件+软件”双重安全隔离体系。


技术架构上,Gemini助手和Waymo Driver物理隔离,通过硬件阻断通信,确保AI无法访问或干预驾驶系统的传感器数据和决策模块,从根源避免“AI误操作致车辆失控”的风险。


软件层面,1200行提示词中近30%用于定义安全边界:禁止AI猜测、解释或辩护驾驶行为;乘客问Waymo事故视频等敏感问题时,礼貌转移话题,不用防御或道歉语气;乘客要求“开快点”“改路线”等驾驶控制指令,AI必须明确“无法控制Waymo Driver”,并可主动提供预计到达时间等替代信息。


Waymo内部测试数据显示,这套隔离机制效果显著:搭载Gemini助手的车辆乘客满意度提升27%,“对驾驶系统误解”的投诉率下降41%。正如智能驾驶专家朱西产所说,L3及以上自动驾驶的核心是让用户“清楚知道系统的能力边界”。


Waymo Gemini与特斯拉Grok的对比


Gemini上车背后,是智能汽车“AI副驾”赛道的竞争。特斯拉2025年7月就宣布将xAI的Grok大模型植入车辆,形成直接竞争,但两者产品逻辑差异明显:



特斯拉CEO马斯克曾说“不是汽车装了AI,而是AI长了轮子”,Grok的设计体现了这一理念——支持12种个性角色切换,能根据路况主动讲段子解压,还可连接智能家居。而Waymo的Gemini始终坚守“出行服务”本质,拒绝过度拟人化。这种差异源于商业场景不同:特斯拉面向私家车用户,追求情感连接和用户粘性;Waymo聚焦共享出行,更强调标准化、安全性和普适性


自动驾驶从“能开”到“开好”的转变


Gemini的整合,标志着自动驾驶行业从“功能实现”向“体验优化”转型。Waymo的实践揭示了三个关键趋势:


首先,AI助手是构建信任的关键。无人驾驶车辆没有人类司机,拟人化的AI交互能缓解乘客焦虑。Waymo用“温和音色+明确边界声明”,在“拟人化”“安全性”间找到平衡。


其次,大模型上车需“场景化精简”。谷歌Gemini是顶尖多模态大模型,能力远超车载需求,但Waymo通过1200行提示词精准约束,只保留出行相关核心功能。这种“有所不为”的克制,是大模型商业化落地的关键——避免功能冗余带来安全风险和用户困惑。


最后,生态协同是核心竞争力。Gemini与Waymo的整合,是Alphabet生态资源协同的缩影。就像谷歌DeepMind和Google Brain合并后的技术合力,“大模型+自动驾驶”的生态协同,将成为传统车企难以跨越的壁垒。


目前,Waymo自动驾驶车队覆盖全美6个城市,超2000辆车,圣何塞机场的商业运营许可让场景拓展更进了一步。随着Gemini助手逐步落地,Waymo不仅在重构无人驾驶的出行体验,还在定义智能交通时代的人机交互模式。这场AI副驾的竞争,终将重塑汽车行业的价值链——当驾驶不再是核心竞争力,“如何让出行更智能舒适”就成了新战场。


本文来自微信公众号“山自”,作者:Rayking629,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com