当前位置:首页 > 科技资讯 > 正文

谷歌DeepResearch Agent再升级,挑战GPT-5.2

谷歌和OpenAI正展开激烈竞争,双方通过新产品互相较量。

近日,OpenAI利用专家级GPT-5.2成功反击Gemini 3。

而在GPT-5.2发布前的一个多小时,谷歌推出了全新版Gemini Deep Research Agent

谷歌DeepResearch Agent再升级,挑战GPT-5.2 DeepResearch Agent GPT-5.2 Gemini 3 AI技术 第1张

谷歌对Gemini深度研究进行了重新构想,使其功能比以往任何时候都更加强大。

新版Deep Research Agent基于Gemini 3 Pro构建;

通过多步强化学习训练,提高准确性并减少幻觉;

它能够处理海量上下文,并提供引用来源验证提出的每一个观点。

谷歌DeepResearch Agent再升级,挑战GPT-5.2 DeepResearch Agent GPT-5.2 Gemini 3 AI技术 第2张

除了Deep Research Agent功能更新,还放出了另外两项全新能力:

开源新网络研究Agent基准DeepSearchQA,验证智能体在网络研究任务中的全面性;

推出全新交互API(Interactions API)

虽然GPT-5.2刚刚发布无法对比,但谷歌DeepMind产品经理路Lukas Haas在社交平台X上透露:

谷歌DeepResearch Agent再升级,挑战GPT-5.2 DeepResearch Agent GPT-5.2 Gemini 3 AI技术 第3张

最新版Gemini Deep Research Agent在谷歌新基准测试上得分46.4%,在BrowseComp上与GPT-5 Pro相当,价格却低了一个数量级。

谷歌DeepResearch Agent再升级,挑战GPT-5.2 DeepResearch Agent GPT-5.2 Gemini 3 AI技术 第4张

深度研究,更「深度」了

Gemini Deep Research是一款专为长时间上下文收集与综合任务优化的智能体。

该智能体的推理核心采用迄今为止最具事实准确性的Gemini 3 Pro模型,并经过专门训练,以在复杂任务中减少幻觉生成并最大化报告质量。

通过扩展多步强化学习在搜索中的应用,该智能体能够以高精度自主驾驭复杂的信息环境。

谷歌DeepResearch Agent再升级,挑战GPT-5.2 DeepResearch Agent GPT-5.2 Gemini 3 AI技术 第5张

Gemini Deep Research在完整Humanity's Last Exam(HLE)测试集中达到46.4%的领先水平,在DeepSearchQA上取得66.1%的优异成绩,并在BrowseComp测试中获得59.2%的高分表现。

DeepResearch采用迭代式研究规划机制——它会制定查询、阅读结果、识别知识缺口并再次搜索。

本次版本大幅改进了网络搜索功能,使其能够深入网站获取特定数据。

该智能体经过优化,能够以更低成本生成经过充分研究的报告。

简单聊聊深度研究

深度研究是日常使用AI工具中最高频的功能之一。

谷歌DeepResearch Agent再升级,挑战GPT-5.2 DeepResearch Agent GPT-5.2 Gemini 3 AI技术 第6张

不同于传统的聊天机器人(Chatbot),Deep Research被设计为一个长时程运行的系统,其核心竞争力在于处理「非即时性」的复杂任务。

DeepSearchQA:深度研究智能体的基准测试

谷歌DeepResearch Agent再升级,挑战GPT-5.2 DeepResearch Agent GPT-5.2 Gemini 3 AI技术 第7张

交互API:专为Agent应用开发设计

谷歌DeepResearch Agent再升级,挑战GPT-5.2 DeepResearch Agent GPT-5.2 Gemini 3 AI技术 第8张

“Project Extract”:破解城市规划的“数据孤岛”

“科学新基建”:从AlphaFold到自动化材料实验室