智能咖啡机“耍脾气”背后:生成式AI语音助手的确定性困境

01-20 06:18
这真是个让人哭笑不得的清晨——The Verge的科技记者对着支持Alexa的博世咖啡机说“煮杯咖啡”,本想执行预设程序,结果被升级后的Alexa Plus(亚马逊生成式AI语音助手)一次次拒绝,每次理由还都不一样。2025年将至,AI能写论文、代码、陪聊教书,却连“煮咖啡”这种简单指令都搞不定?

目前还没有人真正解决这个问题:如何让LLM知道什么时候该精确、什么时候可以随机。



这并非个例。社区里吐槽生成式AI语音助手的场面堪称“怨声载道”:开灯成了重灾区,播放歌曲、定时也频频翻车,有人甚至彻底心灰意冷。












现实与预期的反差很鲜明:传统语音助手虽“笨”,但只要念对“咒语”(关键词),结果就可预期;生成式AI助手智商高、理解深、表达丰富,却在开灯、定时等原本擅长的事上频频掉链子。



问题出在哪?LLM天生带随机性,理解多、表达自由的代价是解释空间被放大,包括误解的可能。ChatGPT同一问题不同答案是优势,但放到咖啡机控制这种需即时、可重复、零容错的场景,概率性就是bug。



传统语音助手是“模板匹配器”,不理解语义,只识别关键词填参数,比如“播放广播”后只能跟电台名。亚马逊、谷歌尝试把LLM和智能家居API绑定补确定性短板,却又引新问题:LLM不擅长每次生成完全一致、语法正确的系统调用,控制真实设备时,极小偏差都可能导致操作失败——这就是咖啡机“耍脾气”的原因。



理论上,让新助手达旧助手的可靠性并非不可能,但需大量工程投入、约束设计和失败兜底。现实中,企业更愿先推技术再慢慢修正,我们成了AI的长期内测用户。


既然如此,为何还要抛弃旧技术?因为“潜力”。生成式AI带来的是能力范式切换:代理式AI(Agentic AI)能理解复杂任务关系,动态生成执行逻辑;而传统语音助手是“单指令执行器”,无法理解目标、拆解任务,更不能运行时生成新路径。


社区讨论中,用户也承认新助手的进步:能同时调灯和恒温器,质问“为何不关音乐”时会查原因,摄像头通知从“后院检测到运动”变成“门口出现不熟悉面孔但未进院子”,语音设置复杂Routine比App点设置轻松。


逐渐形成的温和共识是:问题不在引入AI,而在“边界”——是否用AI替代一切。合理方向不是“去按钮化”取代已验证的确定性执行机制,而是让AI帮人理解系统。



当前的混乱,或许不是生成式AI的失败,而是它被放在了不适合的核心位置。这条“边界”何时能清晰勾勒,还未可知。


你的智能家具还好吗?有过抓狂瞬间吗?欢迎评论区聊聊。


参考链接

https://www.theverge.com/tech/845958/ai-smart-home-broken


https://www.reddit.com/r/technology/comments/1pvh1c8/how_ai_broke_the_smart_home_in_2025_the_arrival/


本文来自微信公众号“机器之心”(ID:almosthuman2014),作者:Sia,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com