智东西12月12日消息,今日凌晨,谷歌在比OpenAI早一个小时的时机,推出了三个强大的Agent更新。
Deep Research Agent功能更新并首次向开发者开放;开源新网络研究Agent基准DeepSearchQA,旨在测试Agent在网络研究任务中的全面性;同时推出新交互API(Interactions API)。
Gemini Deep Research是一款专为长期上下文采集和综合任务优化的Agent,其背后的模型是Gemini 3 Pro。通过多步强化学习的扩展搜索,Agent能够自主地以高精度导航复杂的信息环境。此次更新包括针对特定数据进行网页搜索、更低成本生成研究报告等功能。
谷歌DeepMind产品经理路卡斯·哈斯(Lukas Haas)在社交平台透露,新Gemini Deep Research Agent已达到SOTA水平,在谷歌新基准测试上得分46.4%,与GPT-5 Pro相当,且价格更低。
Deep Research Agent将很快在谷歌搜索、笔记本、谷歌金融中提供,并在Gemini应用中升级。
DeepSearchQA内置了900个手工设计的“因果链”任务,涵盖17个领域,可评估Agent在复杂、需要多步查询信息任务上的能力。
交互API作为其与Gemini模型和Agent的统一交互界面,通过Google AI Studio中的Gemini API公开测试版向开发者开放。开发者可通过Agent开发套件(ADK)和A2A协议使用交互API。
有网友评论,谷歌这是把“一个数字版的福尔摩斯交给了开发者”,让应用像写论文一样展开深度调查。
DeepSearchQA开源地址:https://www.kaggle.com/benchmarks/google/dsqa/leaderboard
谷歌博客称,Deep Research背后的Gemini 3 Pro模型是他们迄今为止最真实的模型,该模型经过专门训练,旨在减少幻觉并最大化复杂任务中的报告质量。
Deep Research通过迭代式流程运行,提出问题、阅读结果、识别知识空白,再次进行搜索。其新版本大幅提升了网页搜索功能。
新Gemini Deep Research Agent在完整HLE测试中达到46.4%,Gemini 3 Pro为43.2%,GPT-5 Pro为38.9%。在DeepSearchQA、BrowseComp的测试中以微小优势胜出。
谷歌还优化了该Agent以更低成本生成深度研究报告的功能。
Gemini Deep Research Agent已在需要高精度和基于早期反馈、测试的复杂领域应用,包括金融服务、生物技术和市场调研等行业。
DeepSearchQA是Deep Research Agent的测试基准。
现有基准测试无法反映现实世界多步网络研究的复杂性。谷歌开源新基准DeepSearchQA,用于评估Agent在复杂、需要多步查询信息等任务上的表现。
DeepSearchQA有900个手工设计的“因果链”任务,涵盖17个领域。与传统基于事实的测试不同,它衡量的是全面性,要求Agent生成详尽的答案集。这不仅评估研究的准确性,也包括检索的记忆能力。
交互API原生集成了一套专属接口,专为Agent应用开发场景设计,可高效处理交错式消息、思维链等复杂上下文管理工作。除Gemini模型套件外,还提供首个内置Agent——Gemini Deep Research Agent。
下一步,谷歌将扩展其内置Agent,并提供构建和引入其他Agent的功能,使开发者能够通过一个API连接Gemini模型、谷歌内置Agent和定制Agent。
目前,Deep Research Agent已在金融、科学研究等领域应用。此次更新不仅提升了该Agent的功能,还发布了交互API,以简化与Gemini模型和Agent的交互流程。
本文由主机测评网于2026-05-25发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546142.html