当前位置：首页 > 科技资讯 > 正文

英伟达推出通用深度研究智能体，支持自定义策略

英伟达推出通用深度研究智能体。

最新论文介绍了英伟达的通用深度研究（UDR）系统，该系统支持用户自定义策略，可接入任何大语言模型（LLM）。

英伟达推出通用深度研究智能体，支持自定义策略英伟达深度研究自定义策略通用性第1张

这意味着它能够围绕任何语言模型运行，用户可以完全自定义深度研究策略，并交给智能体实现。

为展示其通用性，英伟达还为UDR配备了带用户界面的研究演示原型，可在GitHub上下载。

网友认为，它使智能体的自主性得到了突破，非常适合企业工作。

英伟达推出通用深度研究智能体，支持自定义策略英伟达深度研究自定义策略通用性第2张

英伟达推出通用深度研究智能体，支持自定义策略英伟达深度研究自定义策略通用性第3张

内置模型和策略

论文介绍，以往推出的所有深度研究智能体，都采用硬编码方式，仅能通过固定的工具选择来执行特定研究策略。

而英伟达的UDR系统能够围绕任何LLM运行。

还能使用户能够在无需额外训练或微调的情况下，创建、编辑和优化他们完全自定义的深度研究策略。

英伟达推出通用深度研究智能体，支持自定义策略英伟达深度研究自定义策略通用性第4张

上图呈现的是一个典型深度研究工具（DRT）的组成部分，与普通的对话式LLMs不同，DRTs在生成报告之前倾向于持续向用户更新其进度。

一个DRT由两部分组成：

一个简单的用户界面：用于接收研究提示，持续向用户更新研究进度，并显示研究报告；

代理逻辑：代码代理（通过代码协调大语言模型与工具的组合运用）或LLM代理（直接利用模型自身的推理和工具调用能力）。

尽管现有的DRTs在某些方面存在局限性，但英伟达的UDR系统提出了一种通用的解决方案来解决这些问题。

英伟达推出通用深度研究智能体，支持自定义策略英伟达深度研究自定义策略通用性第5张

简单地说，与专门的DRT不同，UDR从用户那里接收研究策略和研究提示，允许更高的定制程度。

UDR能够将策略从自然语言编译成可执行的研究编排代码片段，然后执行策略，并将最终报告交付给用户。

不过，这项工作目前还存在一定的局限性。

一方面，UDR系统执行研究策略的准确度取决于底层AI模型生成代码的质量。虽然研究人员通过强制要求代码添加注释来减少错误，但当策略表述模糊或不够具体时，系统偶尔还是会产生理解偏差或逻辑错误。

另一方面，UDR默认用户设计的研究策略本身是合理且可执行的。系统只会做基础检查，不会判断策略步骤是否真正有效。如果策略设计得不好，最终生成的报告可能质量低下、内容不全，或者根本生成不出报告。

英伟达推出通用深度研究智能体，支持自定义策略英伟达深度研究自定义策略通用性第6张

针对上述问题，研究人员也提出了进一步的解决方案——或者说改进方案：

比如配备可修改定制的研究策略库、进一步探索如何让用户控制语言模型的自由推理过程、将大量用户提示自动转化为确定性控制的智能体等。

英伟达推出通用深度研究智能体，支持自定义策略英伟达深度研究自定义策略通用性第7张

目前英伟达的UDR系统还只是原型阶段，并未正式推出，但或许可以期待一下。

本文由主机测评网于2026-04-27发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260440906.html