OpenAI新浏览器,双11购物的救星
你是否还记得当年第一次打开486电脑上IE图标的那种新奇感觉?每年的双11,对毕业多年的我来说,就像一个难以解开的谜题,各种优惠规则复杂得让人算不明白。
但今年情况不同了。我向ChatGPT Atlas(OpenAI上周刚推出的AI浏览器)询问:“我是买iPhone 17还是iPhone 17 Pro?怎么买最划算?”
随后,Atals自动调取我浏览过的商品页,综合历史价格、促销活动和用户口碑,为我总结了每个平台的优缺点和优惠方案。

这一切在一个界面里就轻松完成了,让我不禁感叹,以前购物时的折腾算什么呢?如今的操作丝滑到让我几乎忘了传统“浏览网页”是多么繁琐的动作——要打开搜索引擎,输入关键词,再根据排序一页页翻找,点开内容还可能不对。

那种在网页中迷失方向的迷茫感,我深有体会。要是在上班摸鱼时想对比新iPhone的价格,又不方便刷手机,打开十几个标签页,在几个电商平台间来回切换,比价格、看评价、算优惠,信息凌乱,网页割裂,切换起来手忙脚乱,可我们却早已习惯了。
“小聪明”
浏览器一直在不断进化。2008年Chrome问世,它以更快的加载速度、更简洁的界面和开放的插件生态,开启了现代浏览器的黄金时代。

Chrome开放的生态极大地增强了它的吸引力。此后十年,浏览器迎来功能创新的高峰,标签分组、阅读模式、跨设备同步、插件市场等功能不断涌现。
然而,浏览器虽然变得强大了,但有一点始终没变,它只是为我们打开网页的大门,却从不关心我们是否找到了想要的东西,因为它不理解我们的需求。
直到AI出现,AI插件几乎一夜之间占领了浏览器侧边栏。我们能随时在网页右侧唤出“ChatGPT们”,让AI帮我们总结网页、实时翻译YouTube视频。“AI插件”一度成为竞争激烈的“赛道”,因为谁都不想错过抢占“用户入口”的机会。

AI插件带来的体验提升,主要是减少了在多个网页间跳转的麻烦,但它始终像“外挂”一样,没能整合完整的用户使用场景。比如,它可以帮我们总结网页,却不知道我们搜索问题的源头。简而言之,这种体验提升只是缝补式的,上网方式本质上并未改变。
微软是巨头中行动较快的,它将Copilot集成进Edge里,实现了调用各种插件的功能。Edge有了强大的“副驾驶”,但本质上它并没有成为一个全新的物种。那么,全新的浏览器物种究竟是什么样的呢?
AI浏览器群像
AI浏览器颠覆了传统的主次逻辑,不是在浏览器里添加AI,而是围绕AI来构建浏览器。这场变革的起点要从Arc说起。
2022年,The Browser Company推出Arc浏览器,喊出“重新定义上网”的口号,彻底摒弃了Chrome的老旧模板,把标签页、书签、笔记、下载管理器都整合到侧边栏,让用户能一边浏览一边写笔记。虽然当时没什么AI元素,但Arc让用户第一次意识到,浏览器不只是用来浏览网页,还能延伸到桌面系统。

2023年,Arc开始尝试引入AI,加入了网页总结、跨标签搜索等功能。虽然还依赖GPT - 3等外部模型,但已经让我们看到了浏览器“自我思考”的可能性。到2024年底,Arc宣布停更,团队转而推出全新的AI原生浏览器:Dia,这也被视为“AI浏览器元年”的开端。
2025年,AI浏览器赛道正式爆发,Dia、Comet、Zen、Genspark等纷纷登场。先说师承Arc的Dia,它直接将浏览器变成“互联网的指挥中心”。Dia激进地取消了地址栏和标签页,从一开始就不打算让用户自己浏览。用户只要说出需求,它就会自动去扒拉网页、提炼重点、生成结构化内容。
Dia的重点在于跨网页的协同能力。比如,用户可以同时打开五个长视频、几篇训练计划、三条小红书帖子,然后问Dia“我身高170,体重120,爱踢足球,想重点锻炼臀腿肌肉,根据这些材料,给我制定一个每天45分钟的力量训练方案”。

来自国内的Genspark能基于网页信息生成“Office三件套”。Comet也是极具野心的黑马。我用Comet同时打开几篇学术论文、1.5小时的讲座视频和Google Docs文档,让它执行“提取论文里关于‘深度学习模仿人类注意力机制’的关键段落,结合教授讲座的内容,写一段300字的摘要,最后排版到我的Google Docs里”的任务。Comet会自动在后台完成整个流程,无需我干预,也不影响我做其他事情。

其CEO Srinivas说:“这是构建完成端到端工作流的唯一方式。”这些浏览器风格各异,但底层逻辑相似,它们打破了传统浏览器仅用于访问信息的局限,将分散的信息孤岛聚合起来。交互逻辑也变成了人和AI相互协作,由AI操作浏览器执行命令。
欢迎来到“指令上网”时代
最近试用Atlas时,我发现它进一步完善了人和AI交互的问题。在使用大模型取代传统搜索引擎回复查询、用Agent自动化执行用户指令方面,Atlas和其他AI浏览器并无太大差异。

举个例子,前一阵我玩游戏遇到一个大Bug,困扰了我好几天。在Dia上,我打开大量论坛、帖子和YouTube视频,它帮我分析总结出Bug原因和解决方案,已经很智能了。但在Atlas上,它不仅能做到这些,还会记得我更早之前提到的电脑配置、显示设置、看过的帖子,以及我已经尝试过的方法。然后它给出针对性建议:“你这个Bug,可能和DLSS模式有关。你之前提到游戏开的是‘超高质量’,建议尝试DLAA或关闭光追测试下帧率变化。”


再比如,我花了很多天做旅行规划,搜索旅行路线、看机票、浏览酒店。当我觉得差不多时,告诉Atlas“帮我整理上次看的那几个酒店,再推荐几个同类型的,按位置和价格排个名”。Atlas会调出过往对话历史、网页记录,判断出我目标酒店的位置、价位、星级等信息,为我找到更多同类型酒店,并总结不同酒店的优劣势。
这体现了Atlas在“理解用户”层面的强大能力,原因在于ChatGPT是它的核心。Atlas是OpenAI发出的一个战略信号,我们所有的需求都可以交给ChatGPT,然后由AI帮我们上网寻找答案,无论是查询、创作还是工作。
Sam Altman发布ChatGPT Atlas时说:“我们认为AI代表了十年难遇的一次机会,让我们重新思考浏览器。”过去浏览器是基于网页存在的,这与万维网的设计初衷有关。而AI正在重塑我们获取和处理信息的方式,我们不再“围着网页转”。
我们不必再自己操作网页、摸索答案,只需发指令,让AI代为执行。Comet CEO Srinivas曾表示要将浏览器打造成一个操作系统,这也是所有AI浏览器的野心。AI Agent是系统的核心,负责完成用户交付的一切任务,让浏览器从“浏览”转变为“做事”。
每一次范式转移都会引发关于信任和伦理的“大讨论”,涉及隐私、数据边界、信息控制等问题,技术史向来如此。而且,改变用户习惯更是难上加难。
Atlas给我的感觉,有些像初代iPhone,它不是功能最齐全的,但却最具未来感。
本文来自微信公众号 “果壳”(ID:Guokr42),作者:糕级冻雾,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



