在全球人工智能领域竞争日益激烈的背景下,谷歌与OpenAI在同一天发布了重要更新,引发了整个行业的广泛关注。
昨晚,谷歌发布了全新“重构”的Gemini Deep Research版本,并首次开放了嵌入式研究智能体API。
与此同时,OpenAI正式推出了备受期待的GPT-5.2(代号Garlic)。两家公司在智能体未来、基础大模型能力边界以及应用生态主导权方面的竞争,正进入一个前所未有的激烈阶段。
此次,谷歌和OpenAI的更新几乎同时进行,让外界得以清晰观察到这两家全球AI巨头之间的战略对抗节奏。
谷歌推出的全新Gemini Deep Research工具是一款智能Agent,能够整合海量信息并处理提示中的大量上下文数据。谷歌表示,客户使用Deep Research Agent执行的任务范围广泛,从尽职调查到药物毒性安全研究均有涉及。
谷歌还表示,很快会将这款全新的Deep Research Agent集成到其各项服务中,包括谷歌搜索、谷歌财经、Gemini应用以及广受欢迎的NotebookLM。这标志着谷歌正朝着一个未来世界迈出又一步:未来,人类将不再使用谷歌搜索任何内容,而是由人工智能代理代劳。
具体而言,Deep Research Agent有哪些能力?
在这次更新中,Google不仅对Deep Research Agent进行了架构级的重新设计,还以Gemini 3 Pro为核心基础模型,构建了一个更加稳定、准确、可追溯的深度研究系统。新版Deep Research Agent的能力提升可总结为三个关键方向:模型升级、推理稳定性突破以及交互能力全面增强。
先说模型升级。新版Deep Research Agent完全基于Gemini 3 Pro构建,而Gemini 3 Pro被谷歌视为其迄今最“真实”、最可靠、最适合长链推理的旗舰模型版本。谷歌强调,这不仅是性能提升,更是研究型智能体“可依赖性”的质变。
为了构建这样的智能体,谷歌采用了多步强化学习(Reinforcement Learning over Multi-step Trajectories)的训练策略。其目标非常明确:在长达数十步、数百步的复杂研究任务中,AI必须保持推理路径稳定,减少出现幻觉的概率,并确保连续决策过程中的一致性。
传统LLM在长链推理中的主要痛点之一,就是每一步推理都会引入累计误差——只要一个幻觉性的节点,就可能导致整个输出结果失效。谷歌强调,新版Deep Research在这一点上取得重大突破:
这使得Deep Research可以承担以往LLM无法胜任的任务,例如完整执行跨天级研究、政策评估、多源数据整合和全流程尽职调查。
新版Deep Research Agent的另一个核心优势是其超大规模上下文处理能力。在Gemini 3 Pro的支持下,它可以一次性处理远超以往的资料量,包括学术论文、官方报告、长篇网页内容等。更重要的是,谷歌为Deep Research加入了一项“研究级标准能力”:它会为每一条观点、每一个结论自动附上可追溯引用来源。引用不仅是网址链接,而是结构化地指向原文中的关键片段或段落,以确保输出可信、观点可查,用户可进行二次调查与审核。这使Deep Research不是“生成内容”,而是“提供带证据链的研究结果”。
这次版本更新不仅是功能升级,而是谷歌围绕“研究型智能体生态”的一次系统性发布。除了Deep Research Agent更新,谷歌还推出两项关键新能力:开源全新网络研究智能体基准:DeepSearchQA和全新交互API。
在当前行业中,网络研究型智能体缺乏统一衡量标准。为了证明谷歌取得的进展,谷歌又创建了一个新的基准测试。这个新基准测试名为DeepSearchQA,旨在测试智能体在复杂的多步骤信息检索任务中的表现。谷歌已将该基准测试开源。
对比pass@8和pass@1的结果,可以证明让智能体探索多条并行路径进行答案验证的价值。这些结果是在DeepSearchQA的200个提示子集上计算得出的。
Gemini Deep Research在完整的“人类最后的考试”(HLE)数据集上取得了46.4%的领先成绩,在DeepSearchQA上取得了66.1%的成绩,在BrowseComp上取得了高达59.2%的成绩。
Interactions API是谷歌此次发布的最具战略意义的能力之一。它让开发者首次能够以结构化方式控制智能体的行为状态、推理步骤、长链任务执行、中间状态存储等。这意味着以前开发者只能“向模型发问”,而现在开发者可以“调教智能体如何执行任务”。
在谷歌发布新版Deep Research Agent后,技术社区的反应同样值得关注。
本文由主机测评网于2026-05-25发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546193.html