英伟达推出通用深度研究智能体。
最新论文介绍了英伟达的通用深度研究(UDR)系统,该系统支持用户自定义策略,可接入任何大语言模型(LLM)。
这意味着它能够围绕任何语言模型运行,用户可以完全自定义深度研究策略,并交给智能体实现。
为展示其通用性,英伟达还为UDR配备了带用户界面的研究演示原型,可在GitHub上下载。
网友认为,它使智能体的自主性得到了突破,非常适合企业工作。
论文介绍,以往推出的所有深度研究智能体,都采用硬编码方式,仅能通过固定的工具选择来执行特定研究策略。
而英伟达的UDR系统能够围绕任何LLM运行。
还能使用户能够在无需额外训练或微调的情况下,创建、编辑和优化他们完全自定义的深度研究策略。
上图呈现的是一个典型深度研究工具(DRT)的组成部分,与普通的对话式LLMs不同,DRTs在生成报告之前倾向于持续向用户更新其进度。
一个DRT由两部分组成:
一个简单的用户界面:用于接收研究提示,持续向用户更新研究进度,并显示研究报告;
代理逻辑:代码代理(通过代码协调大语言模型与工具的组合运用)或LLM代理(直接利用模型自身的推理和工具调用能力)。
尽管现有的DRTs在某些方面存在局限性,但英伟达的UDR系统提出了一种通用的解决方案来解决这些问题。
简单地说,与专门的DRT不同,UDR从用户那里接收研究策略和研究提示,允许更高的定制程度。
UDR能够将策略从自然语言编译成可执行的研究编排代码片段,然后执行策略,并将最终报告交付给用户。
不过,这项工作目前还存在一定的局限性。
一方面,UDR系统执行研究策略的准确度取决于底层AI模型生成代码的质量。虽然研究人员通过强制要求代码添加注释来减少错误,但当策略表述模糊或不够具体时,系统偶尔还是会产生理解偏差或逻辑错误。
另一方面,UDR默认用户设计的研究策略本身是合理且可执行的。系统只会做基础检查,不会判断策略步骤是否真正有效。如果策略设计得不好,最终生成的报告可能质量低下、内容不全,或者根本生成不出报告。
针对上述问题,研究人员也提出了进一步的解决方案——或者说改进方案:
比如配备可修改定制的研究策略库、进一步探索如何让用户控制语言模型的自由推理过程、将大量用户提示自动转化为确定性控制的智能体等。
目前英伟达的UDR系统还只是原型阶段,并未正式推出,但或许可以期待一下。
本文由主机测评网于2026-04-27发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260440906.html