当前位置:首页 > 科技资讯 > 正文

谷歌与OpenAI同日更新:智能体竞赛白热化

在全球人工智能领域竞争日益激烈的背景下,谷歌与OpenAI在同一天发布了重要更新,引发了整个行业的广泛关注。

昨晚,谷歌发布了全新“重构”的Gemini Deep Research版本,并首次开放了嵌入式研究智能体API。

谷歌与OpenAI同日更新:智能体竞赛白热化 谷歌 OpenAI Gemini Deep Research GPT-5.2 第1张

与此同时,OpenAI正式推出了备受期待的GPT-5.2(代号Garlic)。两家公司在智能体未来、基础大模型能力边界以及应用生态主导权方面的竞争,正进入一个前所未有的激烈阶段。

此次,谷歌和OpenAI的更新几乎同时进行,让外界得以清晰观察到这两家全球AI巨头之间的战略对抗节奏。

谷歌与OpenAI同日更新:智能体竞赛白热化 谷歌 OpenAI Gemini Deep Research GPT-5.2 第2张

1 谷歌推出全新Deep Research Agent

谷歌推出的全新Gemini Deep Research工具是一款智能Agent,能够整合海量信息并处理提示中的大量上下文数据。谷歌表示,客户使用Deep Research Agent执行的任务范围广泛,从尽职调查到药物毒性安全研究均有涉及。

谷歌还表示,很快会将这款全新的Deep Research Agent集成到其各项服务中,包括谷歌搜索、谷歌财经、Gemini应用以及广受欢迎的NotebookLM。这标志着谷歌正朝着一个未来世界迈出又一步:未来,人类将不再使用谷歌搜索任何内容,而是由人工智能代理代劳。

具体而言,Deep Research Agent有哪些能力?

在这次更新中,Google不仅对Deep Research Agent进行了架构级的重新设计,还以Gemini 3 Pro为核心基础模型,构建了一个更加稳定、准确、可追溯的深度研究系统。新版Deep Research Agent的能力提升可总结为三个关键方向:模型升级、推理稳定性突破以及交互能力全面增强

先说模型升级。新版Deep Research Agent完全基于Gemini 3 Pro构建,而Gemini 3 Pro被谷歌视为其迄今最“真实”、最可靠、最适合长链推理的旗舰模型版本。谷歌强调,这不仅是性能提升,更是研究型智能体“可依赖性”的质变。

为了构建这样的智能体,谷歌采用了多步强化学习(Reinforcement Learning over Multi-step Trajectories)的训练策略。其目标非常明确:在长达数十步、数百步的复杂研究任务中,AI必须保持推理路径稳定,减少出现幻觉的概率,并确保连续决策过程中的一致性。

传统LLM在长链推理中的主要痛点之一,就是每一步推理都会引入累计误差——只要一个幻觉性的节点,就可能导致整个输出结果失效。谷歌强调,新版Deep Research在这一点上取得重大突破:

  • 多轮强化学习优化决策序列
  • 在冗长任务链中显著减少逻辑偏移
  • 更稳定的检索—分析—推理—引用闭环

这使得Deep Research可以承担以往LLM无法胜任的任务,例如完整执行跨天级研究、政策评估、多源数据整合和全流程尽职调查。

新版Deep Research Agent的另一个核心优势是其超大规模上下文处理能力。在Gemini 3 Pro的支持下,它可以一次性处理远超以往的资料量,包括学术论文、官方报告、长篇网页内容等。更重要的是,谷歌为Deep Research加入了一项“研究级标准能力”:它会为每一条观点、每一个结论自动附上可追溯引用来源。引用不仅是网址链接,而是结构化地指向原文中的关键片段或段落,以确保输出可信、观点可查,用户可进行二次调查与审核。这使Deep Research不是“生成内容”,而是“提供带证据链的研究结果”。

这次版本更新不仅是功能升级,而是谷歌围绕“研究型智能体生态”的一次系统性发布。除了Deep Research Agent更新,谷歌还推出两项关键新能力:开源全新网络研究智能体基准:DeepSearchQA和全新交互API

在当前行业中,网络研究型智能体缺乏统一衡量标准。为了证明谷歌取得的进展,谷歌又创建了一个新的基准测试。这个新基准测试名为DeepSearchQA,旨在测试智能体在复杂的多步骤信息检索任务中的表现。谷歌已将该基准测试开源。

谷歌与OpenAI同日更新:智能体竞赛白热化 谷歌 OpenAI Gemini Deep Research GPT-5.2 第3张

对比pass@8和pass@1的结果,可以证明让智能体探索多条并行路径进行答案验证的价值。这些结果是在DeepSearchQA的200个提示子集上计算得出的。

Gemini Deep Research在完整的“人类最后的考试”(HLE)数据集上取得了46.4%的领先成绩,在DeepSearchQA上取得了66.1%的成绩,在BrowseComp上取得了高达59.2%的成绩。

谷歌与OpenAI同日更新:智能体竞赛白热化 谷歌 OpenAI Gemini Deep Research GPT-5.2 第4张

Interactions API是谷歌此次发布的最具战略意义的能力之一。它让开发者首次能够以结构化方式控制智能体的行为状态、推理步骤、长链任务执行、中间状态存储等。这意味着以前开发者只能“向模型发问”,而现在开发者可以“调教智能体如何执行任务”。

谷歌与OpenAI同日更新:智能体竞赛白热化 谷歌 OpenAI Gemini Deep Research GPT-5.2 第5张

2 网友怎么看?

在谷歌发布新版Deep Research Agent后,技术社区的反应同样值得关注。

谷歌与OpenAI同日更新:智能体竞赛白热化 谷歌 OpenAI Gemini Deep Research GPT-5.2 第6张