当前位置:首页 > 科技资讯 > 正文

AI驱动搜索的未来:Google如何从语义理解走向世界索引

AI驱动搜索的未来:Google如何从语义理解走向世界索引 AI搜索  语义理解 Google AI模式 产品设计哲学 第1张

最近我收听了一期内容充实的播客节目。

原稿为英文,得益于现代科技可即时翻译成中文。这期节目源自Lenny’s Podcast,一个专注产品管理、用户增长和职业发展的系列播客。

嘉宾是Robbie Stein,现任Google搜索产品副总裁。

他曾在Instagram担任产品总监,主导了Stories、Reels和Close Friends等功能的开发。如果你熟悉国外互联网演进史,会了解他几乎重新定义了社交产品的表达方式。

如今他加入谷歌,主导Google搜索的「提问方式」革新。

因此,整期播客围绕AI模式、AI驱动搜索的未来展开,我认为非常有趣,其逻辑近乎逆向思考。

01

主持人Lenny开场提到,过去两年ChatGPT、Perplexity、Claude等聊天机器人迅速崛起,外界普遍认为Google面临危机,AI将终结搜索时代。你对此如何看待?

Robbie回应:AI并未改变人类的基本需求,但我们发现AI具有扩张性特质。

搜索旨在查找答案;如今AI让人们能提出更复杂、模糊、带有情境的问题,因此,AI实际上让问题数量增加了。

你可以拍摄鞋子照片询问「我能在哪里购买这双鞋」,拍摄作业题目询问「第二问哪里出错了」,甚至拍摄一整排书架询问「我还应该阅读哪本书」。

目前来看,Google Lens的搜索量在过去一年增长了70%,这是一个规模巨大的增长曲线;这标志着「提问方式的变化」:人们开始直接使用图像、语音和情境进行提问。

Robbie提及一个细节:

人们使用搜索出于多样目的——查询价格、寻找路线、核对账单、查看政策、搜索税务网页;AI没有改变基础需求,它只是让提问变得更加自然。

当前的AI模式,使Google能够回答你原本不会提出的问题;它理解你提问的原因、上下文以及问题背后的意图。

这意味着,未来的AI首次具备了「理解能力」。

Robbie的表述稍带技术性,但核心清晰:Google正演变成一个能对问题做语义展开的思考层。

系统自动将你的问题拆分为多个子问题,在后台进行并行搜索,随后用AI汇总出带引用、可追溯的回答;这一层本质上「机器在协助人类重写问题」。

当机器开始理解提问,搜索的意义也被重新构建。

Lenny进一步追问:那么,你并不担心人们习惯使用ChatGPT,而遗忘Google?

Robbie表示:不担心;我们的目标是让人们「更容易进行搜索」;AI扩展了问题的范围,搜索成为一种被AI扩张的语言形式,这是谷歌的战略焦点。

因此,搜索形态在变化,提问方式也在演变。

02

那么它究竟如何改变呢?Robbie分析了产品设计哲学。在他的逻辑中,有一个词反复出现:AI Mode。

具备思考能力的搜索框。你仍在用Google,但当提问时,系统会自动进入AI Mode,调用最新大模型,协助综合分析结果、筛选信息、生成摘要,并附上引用来源。

听起来似乎与国内搜索无太大差别。

但Robbie强调,他们不做通用聊天型AI,不做创作或生产力工具,也不做仅用于信息检索的AI。

他使用了一个术语:information retrieval AI;简而言之,ChatGPT旨在成为会聊天的伙伴,而Google则想构建一个懂信息、可信任的系统。

这是两条截然不同的路径。

我们的回答必须可追溯,要能让用户点击返回查看来源。ChatGPT的目标是生成语言,Google的目标是理解语言,一个追求流畅自然,一个追求准确验证。

AI Mode的答案使网页变得更有意义;这背后的逻辑,是让机器真正「理解问题」。

他举例说明:

当你询问「东京三天旅游怎么安排」,系统除了提供行程清单外,还会自动在后台生成十几个并行搜索。

诸如天气、交通、开放时间、热门地点、用户评分、本地饮食等信息都会呈现。这被称为「Query Fan-Out」(查询扩展)。

我们首次让模型在问题层面进行思考。他说,Google之所以能做到这一点,是因为它在过去十几年里,几乎将整个世界「结构化」了。

Google Shopping Graph现在包含500亿件商品,商家每小时更新20亿次;Google Maps上有2.5亿个地点

再加上网页内容、评论、新闻、知识图谱的上下文连接,这些不断训练模型,使它在理解问题时,能「知道自己在说什么」。

换句话说,当你提问时,它了解鞋子与店铺的关系,了解餐馆在地图上的分布,也了解这条街上谁在撰写点评,这是AI Mode与其他聊天型AI的分水岭,基于「拥有世界坐标」来理解你的问题。

整个过程中,Google底层系统同时进行反垃圾过滤、权威性评估、自动引用生成等一系列隐形机制。

因此,当你看到一段回答时,背后已运行上百个验证流程。Robbie说,这些验证流程旨在让Google未来学会「理解世界」。

他提出了一个说法:从索引网页,走向索引世界。

过去,我们对搜索的想象是一个输入框连接无数网页,你输入几个词,它就去互联网翻箱倒柜。现在不同了,搜索正演变为一层「世界接口」。

为何是世界接口?

我可以拍摄一朵花询问「这是什么花」,拍摄房间询问「如何重新布置」,甚至拍摄一双鞋询问「哪里能买到」。

如今的AI搜索,将视觉(Lens)、文字、语音融合在一起,形成一种「端到端」体验。你可以追问、反问,它都能应对自如。

你甚至可以直接访问 google.com/ai 打开它,也可以在核心搜索中触发。

例如:

用户会输入一个五句长的问题到Google,上方先出现AI Overviews的预览;想深入探究,就能一键切换至AI Mode继续对话。

拍照同理。拍摄完图片,它先给出一段预览,点击进入,又回到熟悉的对话框;理想状态下,用户不应思考自己在何处提问,产品需保持一致与简洁。

Robbie说,这是Google正在构建的未来。

那么,为何它能理解「世界语境」?

一方面,多模态将文字、图像、空间线索交织在一起;另一方面,拥有基础搜索的底蕴,这些细节组合起来,搜索就进入了一种新状态。

从拍照、购物、聊天到浏览,任何时刻都可能成为一场搜索。这就是「世界语义」,立体的、3D的。从理解语言,到理解场景,再到理解关系与意图,一个被彻底重构的信息网络。

03

当AI开始理解世界,它将如何重新分配信息?Robbie说,AI会让「优质信息更具价值」。

传统SEO侧重「关键词」——谁懂算法,谁写得迎合,谁能排名靠前; AI搜索强调「语义相关性」:谁真正解决了问题,谁就被模型选中。

AI会在后台发起几十个子查询,寻找「最能解决用户问题的网页」,那些堆砌词汇、灌水、拼凑的内容基本没有机会。

换言之,以前我们写内容「面向人类阅读」,现在,我们必须学会「面向机器理解」。

这是从SEO到AEO的转折,从Search Engine Optimization,变为AI Engine Optimization,从争夺流量,变为争夺理解。

看到这里,你或许会问,怎么又冒出一个新名词?AEO、GEO究竟有何区别?我理解,它们意思相近,但角度不同。

Robbie认为,AEO关注信息的语义质量、可验证性和上下文关联度。它站在「搜索引擎」端,决定AI如何选择答案,而GEO,则是内容创作端的延伸,关注「如何让生成式AI更容易理解你的内容」。

简单来说,前者在教导AI如何选人,后者在教导我们如何让自己被选中。以前比拼关键词,现在比拼语义。谁能被机器理解,谁就能获得流量。

因此,这些外部变化,也会悄然改变「提问者」。

Robbie说,他们希望AI搜索能理解人,过去搜索是一次性的,你提问,它回答,结束;现在AI Mode能记住上下文、语气、语义。

它知道你之前问过什么,也能判断你是否在换个方式追问。

这意味着AI开始学习人,学习偏好、意图、语气;甚至,你的停顿、删改、补充一句「其实我想问的是」,都成为它判断你身份的线索。

久而久之,你会发现:它越来越像一个会「接话」的人,未来,它成为一种「语义上的伴侣」。

Robbie的终极思想是产品要做到「清晰」与「速度」;他说,一个伟大产品,在于用户是否能「一眼看懂」,是否能「立即完成」。

他提到三条黄金法则:

Be clear, not clever(清晰胜过聪明)

Never be satisfied(永不满足)

Execution beats theory(执行胜过空谈)

这三句话听起来有些抽象,他解释认为AI让所有人都变得「聪明」,但「清晰」反而成为稀缺品;用户永不满足,产品设计应让人更快抵达目的地。

他在Instagram开发Stories时学到的最大一课,是避免让用户思考;现在负责Google搜索,也延续让人「更快、更准、更自然」地提问与获取结果。

我认为,这蕴含一个更大的隐喻:无论技术如何演进,产品的终极目标从来不是炫技,而是「让人更贴近人性」。

当所有人都在谈论AI的「强大」,Robbie却提醒:真正的创新,是让世界更简单。或许,这是产品的最高境界,让人不觉复杂,却能感受被理解。

参考:

[1].Robbie Stein | Inside Google’s AI turnaround: AI Mode, AI Overviews, and vision for AI-powered search (YouTube);链接:https://www.youtube.com/watch?v=kOnsqqVbIeY