当前位置:首页 > 科技资讯 > 正文

英伟达推出通用深度研究智能体,支持自定义策略

英伟达推出通用深度研究智能体

最新论文介绍了英伟达的通用深度研究(UDR)系统,该系统支持用户自定义策略,可接入任何大语言模型(LLM)。

英伟达推出通用深度研究智能体,支持自定义策略 英伟达 深度研究 自定义策略 通用性 第1张

这意味着它能够围绕任何语言模型运行,用户可以完全自定义深度研究策略,并交给智能体实现。

为展示其通用性,英伟达还为UDR配备了带用户界面的研究演示原型,可在GitHub上下载。

网友认为,它使智能体的自主性得到了突破,非常适合企业工作。

英伟达推出通用深度研究智能体,支持自定义策略 英伟达 深度研究 自定义策略 通用性 第2张

英伟达推出通用深度研究智能体,支持自定义策略 英伟达 深度研究 自定义策略 通用性 第3张

内置模型和策略

论文介绍,以往推出的所有深度研究智能体,都采用硬编码方式,仅能通过固定的工具选择来执行特定研究策略。

而英伟达的UDR系统能够围绕任何LLM运行。

还能使用户能够在无需额外训练或微调的情况下,创建、编辑和优化他们完全自定义的深度研究策略。

英伟达推出通用深度研究智能体,支持自定义策略 英伟达 深度研究 自定义策略 通用性 第4张

上图呈现的是一个典型深度研究工具(DRT)的组成部分,与普通的对话式LLMs不同,DRTs在生成报告之前倾向于持续向用户更新其进度。

一个DRT由两部分组成:

一个简单的用户界面:用于接收研究提示,持续向用户更新研究进度,并显示研究报告;

代理逻辑:代码代理(通过代码协调大语言模型与工具的组合运用)或LLM代理(直接利用模型自身的推理和工具调用能力)。

尽管现有的DRTs在某些方面存在局限性,但英伟达的UDR系统提出了一种通用的解决方案来解决这些问题。

英伟达推出通用深度研究智能体,支持自定义策略 英伟达 深度研究 自定义策略 通用性 第5张

简单地说,与专门的DRT不同,UDR从用户那里接收研究策略和研究提示,允许更高的定制程度。

UDR能够将策略从自然语言编译成可执行的研究编排代码片段,然后执行策略,并将最终报告交付给用户。

仍需进一步探索

不过,这项工作目前还存在一定的局限性。

一方面,UDR系统执行研究策略的准确度取决于底层AI模型生成代码的质量。虽然研究人员通过强制要求代码添加注释来减少错误,但当策略表述模糊或不够具体时,系统偶尔还是会产生理解偏差或逻辑错误。

另一方面,UDR默认用户设计的研究策略本身是合理且可执行的。系统只会做基础检查,不会判断策略步骤是否真正有效。如果策略设计得不好,最终生成的报告可能质量低下、内容不全,或者根本生成不出报告。

英伟达推出通用深度研究智能体,支持自定义策略 英伟达 深度研究 自定义策略 通用性 第6张

针对上述问题,研究人员也提出了进一步的解决方案——或者说改进方案:

比如配备可修改定制的研究策略库、进一步探索如何让用户控制语言模型的自由推理过程、将大量用户提示自动转化为确定性控制的智能体等。

英伟达推出通用深度研究智能体,支持自定义策略 英伟达 深度研究 自定义策略 通用性 第7张

目前英伟达的UDR系统还只是原型阶段,并未正式推出,但或许可以期待一下。