当前位置:首页 > 科技资讯 > 正文

AI浏览器革命:从手动浏览到智能指令的飞跃

每年的双11购物节,都像一场数学考试,让我这个高中毕业多年的人感到困惑——优惠计算复杂,难以抉择。但今年,一切都不同了。

我问ChatGPT Atlas(OpenAI上周推出的AI浏览器),“我该买iPhone 17还是iPhone 17 Pro?怎么买最划算?”

然后,Atlas自动调取我浏览过的商品页,综合历史价格、促销活动和用户口碑,为我总结每个平台的优缺点和优惠方案......

AI浏览器革命:从手动浏览到智能指令的飞跃 AI浏览器  ChatGPT Atlas 双11购物 上网方式变革 第1张

如今的商战,似乎只能交给AI来应对了|图源:ChatGPT Atlas

这些在一个界面里就完成了(那我以前遭的罪算什么???),流畅得几乎让我忘记,“浏览网页”曾是多么“具体”的动作——打开搜索引擎,输入关键词,根据排序一页页翻找,点开内容却发现不对。

AI浏览器革命:从手动浏览到智能指令的飞跃 AI浏览器  ChatGPT Atlas 双11购物 上网方式变革 第2张

经常有种“我这是到了哪里?”的迷茫感|作者截图

如果想在上班摸鱼时比较新iPhone的价格,又不好刷手机,开了十几个标签页,在几个电商平台间来回切换,比价格、看评价、算优惠......

信息是零散的,网页是割裂的,切换起来手忙脚乱——但我们习惯了。

“小聪明”

浏览器一直在进化,变得更智能。

Chrome从2008年开始,以更快的加载速度、更干净的界面和开放的插件生态,带来了现代浏览器的黄金时代。

AI浏览器革命:从手动浏览到智能指令的飞跃 AI浏览器  ChatGPT Atlas 双11购物 上网方式变革 第3张

Chrome的开放生态极大增强了它的吸引力|作者截图

此后十年,浏览器迎来功能创新高峰,标签分组、阅读模式、跨设备同步、插件市场......

浏览器变得强大,但有一点始终没变:它只负责开门,却不关心你是否找到了想要的东西——因为浏览器不理解你在做什么。

直到AI出现,AI插件几乎一夜之间占领了浏览器侧边栏。你能随时在网页右侧唤出“ChatGPT们”,让AI帮你总结网页,实时翻译YouTube视频。

“AI插件”一度成为一条很卷的“赛道”。原因很简单,谁都不想错过抢占“用户入口”的机会。

AI浏览器革命:从手动浏览到智能指令的飞跃 AI浏览器  ChatGPT Atlas 双11购物 上网方式变革 第4张

Chrome应用商店里的AI插件|作者截图

AI插件带来的体验提升,更多是减少在多个网页间跳转的摩擦感。但它始终像“外挂”一样,没能整合完整的用户使用场景,例如,它可以帮你总结网页,却不知道你从搜索哪个问题而来。

简而言之,这种体验提升是缝补式的,“芯”没换,我们的上网方式没有改变。

微软是巨头中动作最快的一个。微软将Copilot集成进Edge里,实现了调用各种插件功能。Edge有了一个厉害的“副驾驶”,但开车的没变——Edge没有成为一个全新物种。

那么,全新物种长什么样?

AI浏览器群像

AI浏览器颠覆的是一个主次逻辑:不是往浏览器里装AI,而是围着AI造浏览器。

这场变革的起点,要从Arc说起。

2022年,The Browser Company推出Arc浏览器,喊着“重新定义上网”的口号,彻底抛弃了Chrome的老旧模板,把标签页、书签、笔记、下载管理器全塞进侧边栏,能一边浏览一边写笔记。

虽说没什么AI味儿,但Arc让用户们第一次意识到,浏览器不只用来看网页,而是能延伸到桌面系统。

AI浏览器革命:从手动浏览到智能指令的飞跃 AI浏览器  ChatGPT Atlas 双11购物 上网方式变革 第5张

Arc出场方式就不一般|图源:Arc

2023年,Arc开始试水AI,加入了网页总结、跨标签搜索等功能。虽然还依赖GPT-3等外部模型,但已经让人看到了浏览器“自我思考”的可能。

到2024年底,Arc宣布停更,团队转而推出全新的AI原生浏览器:Dia。这也被认为是“AI浏览器元年”的起点。

2025年,AI浏览器赛道正式爆发:Dia、Comet、Zen、Genspark……

先说师承Arc的Dia,直接将浏览器变成“互联网的指挥中心”。

Dia激进地取消了地址栏和标签页,从一开始就不打算让你“自己浏览”。你只要说出需求,它自己去扒拉网页、提炼重点、生成结构化内容。

Dia的重点在跨网页的协同力:你可以同时点开五个长视频、几篇训练计划、三条小红书帖子,再问Dia“我身高170,体重120,爱踢足球,想重点锻炼臀腿肌肉,根据这些材料,给我制定一个每天45分钟的力量训练方案。”

AI浏览器革命:从手动浏览到智能指令的飞跃 AI浏览器  ChatGPT Atlas 双11购物 上网方式变革 第6张

用AI浏览器帮我看视频|图源:Dia

Genspark来自国内,它能基于网页信息生成“Office办公三件套”。

Comet也是极具野心的黑马。我用Comet同时打开几篇学术论文、1.5小时的讲座视频和Google Docs文档,告诉它执行这样的任务,“提取论文里关于‘深度学习模仿人类注意力机制’的关键段落,结合教授讲座的内容,写一段300字的摘要,最后排版到我的Google Docs里。”

Comet自动在后台完成整个链路,不需要我干预,同时也不打扰我做其他事情。

AI浏览器革命:从手动浏览到智能指令的飞跃 AI浏览器  ChatGPT Atlas 双11购物 上网方式变革 第7张

用Comet根据我的需求制定独特的Citywalk路线|图源:Comet

“这是构建完成端到端工作流的唯一方式(指让用户在一个统一的环境中完成一系列连续任务)。”其CEO Srinivas说。

这些浏览器风格迥异,但底层逻辑相似:它们解决了传统浏览器仅是访问信息的局限,将信息孤岛聚合起来。

交互逻辑也变成了人和AI协作,AI操作浏览器执行命令。

欢迎来到“指令上网”时代

最近在试用Atlas时,我发现它又进一步完善了人和AI交互的问题。

用大模型取代传统搜索引擎回复查询,用Agent自动化执行用户指令。这些能力上,Atlas和其他AI浏览器没什么不同。

AI浏览器革命:从手动浏览到智能指令的飞跃 AI浏览器  ChatGPT Atlas 双11购物 上网方式变革 第8张

“记忆”是Atlas核心卖点之一|图源:ChatGPT

但我在这里举一个例子。

前一阵,我在玩游戏时遇到了一个大Bug,连续困扰我好几天。在Dia上,我打开大量论坛、帖子和YouTube视频,它帮我分析完,总结出Bug原因和解决方案。这已经很智能了。

但在Atlas上,除了这些,它会记得我更早之前提到过的电脑配置、显示设置、看过的帖子,甚至我已经尝试过哪些方法。然后它生成了一个针对性的建议,“你这个Bug,可能和DLSS模式有关。你之前提到游戏开的是‘超高质量’,建议尝试DLAA或关闭光追测试下帧率变化。”

AI浏览器革命:从手动浏览到智能指令的飞跃 AI浏览器  ChatGPT Atlas 双11购物 上网方式变革 第9张

同一个指令,上面Atlas的回答串联起我最近看的所有帖子,并且会主动搜索更多信息。下面的Dia,并没有跳出我打开的当前网页|图源:作者自制

AI浏览器革命:从手动浏览到智能指令的飞跃 AI浏览器  ChatGPT Atlas 双11购物 上网方式变革 第10张

Atlas会记住我此前的问题|图源:Atlas

再比如,我花了很多天做旅行规划,搜索旅行路线、看机票、浏览酒店。当我觉得看得差不多了,我告诉Atlas,“帮我整理上次看的那几个酒店,再推荐几个同类型的,按位置和价格排个名。”

然后Atlas会调出过往对话历史、网页记录,判断出我目标酒店的位置、价位、星级等信息,给我找到更多同类别的酒店,再帮我总结不同酒店之间的优劣势。

这是“理解用户”层面的能力。原因是,ChatGPT才是浏览器的“芯”。

Atlas是OpenAI的一个战略信号:你所有的需求都可以涌向ChatGPT,然后AI帮你上网找答案,无论你想查询、创作、工作......

“我们认为AI代表了十年难遇的一次机会,让我们重新思考浏览器。”Sam Altman发布ChatGPT Atlas时这么说。

过去浏览器是基于网页存在的。这与万维网设计初衷有关。而AI正在重塑我们获取和处理信息的方式,导致现在我们不再“围着网页转了”。

我们不必自己操作网页,摸索着找答案,而是发指令,让AI代为执行。

Comet CEO Srinivas曾表示要将浏览器打造成一个操作系统。而这已经是所有AI浏览器的野心。AI Agent是系统的核心,去完成用户交付的一切。让浏览器实现从“浏览”到“做事”的变化。

每一次范式转移,都伴随着一次信任和伦理的“大讨论”,关于隐私、数据边界、信息控制......技术史从来如此。还有,更难的是用户习惯的改变。

怎么说呢,Atlas给我的感觉,有些像初代iPhone,不是功能最全的,却是最像未来的。

封面图来源:Atlas