AI科学家时代正加速来临,哈佛与MIT联合推出的ToolUniverse平台,通过统一接口让AI以自然语言操作600余种科学工具,推动科研自动化全面升级,引领科学发现新范式。
在科学演进的长河中,每一次重大飞跃都伴随着研究工具的突破性创新。随着大语言模型与智能体技术的迅猛发展,这一趋势正迈向一个全新阶段:「AI科学家」的诞生。
在AI赋能科研的前沿领域,我们正见证一个关键转折点:从验证AI智能体「是否能够」解决特定科学问题,转向探索如何使其「高效、可靠、规模化」地参与完整研究流程。
《自然》杂志近期发布新闻解析,重点报道了由哈佛大学Marinka Zitnik和高尚华团队与MIT共同推出的首个大规模工具开源框架ToolUniverse。
新闻链接:https://www.nature.com/articles/d41586-025-03246-7
ToolUniverse提供的在线环境允许研究人员使用自然语言将各类大模型和智能体连接到不同科学领域的常用工具,为打造AI科学家奠定坚实基础。
项目主页:https://aiscientist.tools
论文详解:https://arxiv.org/abs/2509.23426
代码开源:https://github.com/mims-harvard/ToolUniverse
传统大语言模型(LLM)的核心优势在于「文本生成」,但科学研究的需求远不止于此:它要求分解复杂问题(例如「如何优化降胆固醇药物」)、规划实验步骤、调用专业工具(如分子模拟软件)、验证数据合理性,甚至在结果偏离预期时进行自我修正。这种「推理与行动」的闭环,正是AI从「基础模型」升级为「科学家」的关键所在。
AI智能体的突破在于将LLM与三大机制深度整合:
然而,科学研究的特殊性对AI智能体提出了更高要求:不同学科(如生物、化学、物理)的工具格式不统一、数据需可复现、实验流程需严谨验证。若仅依赖通用工具调用协议(如MCP,模型上下文协议),难以解决「如何让AI理解质谱数据格式」「如何协调分子模拟与临床数据库的输出」等专业问题。而这正是ToolUniverse解决的核心挑战之一。
ToolUniverse并非单一工具,而是一套「连接LLM与科学工具」的标准化生态系统(图1)。其核心目标是:让任何LLM都能通过统一接口,调用600余种科学工具,完成从「提出假设」到「验证结论」的全流程研究。
图1:ToolUniverse 是一个用于打造AI科学家的生态系统。通用型大语言模型(LLM)、推理模型与智能体可连接ToolUniverse提供的600余种科学工具,实现科研工作流自动化。
正如HTTP协议统一了互联网通信,ToolUniverse为AI科学家定义了专属的「科学工具交互标准」(图2),既能无缝集成本地部署的开源工具,也能安全、规范地连接强大的闭源模型与API服务,解决了MCP协议在科研场景中的三大痛点:
图2: ToolUniverse通过统一协议连接机器学习模型、智能体、科学软件工具、数据库与API。它引入了标准化的工具规范框架,使语言模型能够一致地发现、调用并解析各类工具。类似于HTTP在互联网通信中确立标准的方式,ToolUniverse 协议通过两项核心操作:Find Tool(查找工具) 与Call Tool(调用工具), 定义了AI科学家如何请求工具并接收结果。
这种标准化设计,使AI从「会使用工具」升级为「会使用科学工具解决问题」。
ToolUniverse通过四大组件(图3),覆盖了AI科学家从「工具获取」到「工作流优化」的全流程需求,真正实现「可编程的科学协作」。
图3: ToolUniverse 提供了六项关键能力,支持AI科学家完整的生命周期:
它解决了「如何将新工具接入生态」的问题:本地工具(如实验室自研的数据分析脚本)只需提交「功能描述+参数格式+输出示例」,即可被自动纳入统一schema;远程工具(如云端分子模拟平台)通过MCP协议接入,无需暴露内部代码,兼顾安全性与兼容性;自动验证工具有效性(如「输入错误分子结构时是否返回提示」),确保AI调用时的可靠性。
科学研究很少依赖单一工具,例如「药物筛选」需要串联「靶点数据库→化合物库→分子对接工具→毒性预测工具」。Tool Composer 的作用是:定义工具间的数据流(如「分子对接工具的输出结构,直接作为毒性预测工具的输入」);支持条件逻辑(如「若毒性预测超标,则返回上一步重新筛选化合物」);生成可复现的工作流脚本,方便人类科学家追溯或修改。通过智能体系统,实现工具间调用关系的自动构建与优化。
当现有工具无法满足需求(如「需要一种新的基因表达数据可视化工具」),AI可通过自然语言描述需求,Tool Discover会:将文本描述转化为结构化工具规格(如「输入:CSV格式表达矩阵;输出:热图+火山图」);自动生成代码、测试用例,通过「预期行为vs实际输出」的反馈循环迭代优化;无需人工编码,让工具库随科研需求动态扩展。
科学研究强调可复现性,Tool Optimizer通过三大动作保障工具稳定性:定期生成测试用例(如「用已知活性的化合物验证分子对接工具的准确性」);分析工具输出与规格的偏差(如「某工具预测的结合能与实验值误差突然增大」);自动更新工具文档或参数设置,确保AI调用时的一致性。
不同科研场景对LLM的需求差异极大:实验室本地分析可能需要轻量开源模型(如Llama 3),而复杂假设推理可能依赖云端大模型(如Claude 3),生物医药研究还需专业模型(如TxAgent)。ToolUniverse的兼容性设计打破了「模型绑定」局限(图4):将工具调用转化为「标准化函数调用」,无需修改LLM的权重或Tokenizer——只需通过轻量级包装器,向模型传递「工具列表+参数格式」,模型输出即可被解析为工具调用指令。这种设计的价值在于:科研团队可根据成本、隐私需求选择模型,无需担心「换模型就要重写工具调用逻辑」;能在相同实验条件下对比不同模型的性能(如「用Gemini-CLI vs Claude 3做药物筛选,哪个准确率更高」);支持专业模型与通用工具的结合(如「让TxAgent调用ChEMBL数据库,分析药物-靶点相互作用」)。
图4: ToolUniverse 为构建不同类型的AI科学家提供了简洁而高效的协议:既可用于基于通用大语言模型(如左图的Claude),也可用于具备更强推理与控制能力的智能体系统(如右图的Gemini-CLI),以及专注于生物医学研究的AI智能体(如TxAgent)。
理论架构需要实践验证。我们以「寻找更安全的降胆固醇药物」为例,展示ToolUniverse构建的AI科学家(基于Gemini-CLI智能体)如何完成全流程研究(图5)。
图5:展示了一个基于ToolUniverse构建并应用于药物发现的AI科学家实例。
步骤1:靶点识别——锁定「关键蛋白」
AI首先调用「文献挖掘工具」和「药物-靶点数据库」,通过分析数千篇研究论文与临床数据,得出结论:HMG-CoA还原酶是胆固醇合成的关键酶,且该酶在肝脏外的过度抑制会引发肌肉疼痛等副作用。这一步复刻了人类科学家的「靶点发现」逻辑,但效率提升10倍以上。
步骤2:起始化合物筛选——从现有药物入手
AI通过ToolUniverse查询「已上市降胆固醇药物库」,筛选出以HMG-CoA还原酶为靶点的药物,最终选择「洛伐他汀(lovastatin)」作为起始化合物——理由是「临床验证充分,但肝外组织渗透率高,存在副作用风险」。
步骤3:化合物优化——提升安全性与有效性
AI调用三大工具协作:ChEMBL数据库获取洛伐他汀的100余种结构类似物;Boltz-2工具预测每个类似物与HMG-CoA还原酶的结合能(数值越低,结合越强);ADMET-AI工具预测类似物的肝渗透率、脑渗透率、代谢稳定性。通过综合排序,AI筛选出两个候选:普伐他汀(pravastatin),已知药物,肝外渗透率低,副作用更少(验证了AI的可靠性);以及新化合物CHEMBL2347006/CHEMBL3970138,结合能比洛伐他汀高30%,脑渗透率降低50%,生物利用度提升25%。
步骤4:专利与验证——规避法律风险
最后,AI调用「专利检索工具」,发现新化合物已被注册用于心血管疾病治疗,虽无法直接开发,但为后续结构修饰提供了方向。整个过程中,AI不仅完成「调用工具」的动作,更体现科学推理能力:它能解释「为何选择该靶点」「为何淘汰某化合物」,甚至根据副作用风险调整优化方向——这正是「AI科学家」与普通工具调用的本质区别。
一个健康的生态系统,其生命力不仅来源于使用,更来源于创造与贡献。ToolUniverse内置了Tool Discover和Tool Optimizer等核心组件,前者允许用户通过自然语言描述自动化生成新工具的规范与代码框架;后者能通过多轮测试与反馈持续优化现有工具的说明与易用性。这一机制巧妙地将用户从纯粹的「消费者」转变为潜在的「共建者」,激励社区智慧反哺生态,形成自我完善、持续生长的良性循环。
ToolUniverse的终极愿景是赋能各个科学领域的专家,而不仅仅是AI专家。当生物学家、化学家、药物研发人员能够基于一个稳定、丰富的工具生态,轻松定制符合其独特研究需求的「AI科研伙伴」时,或许将迎来一个真正AI辅助科研的全新时代。AI科学家不仅能调用数据库、模拟器,还能通过标准化协议控制实验室自动化设备(如液体处理机器人、质谱仪),实现「提出假设→设计实验→自动执行→分析结果」的全流程闭环。当AI能真正理解科学问题、自主协调工具、与人类共同推进认知边界时,我们或许正站在「科学发现新范式」的起点。
ToolUniverse开发团队
https://arxiv.org/abs/2509.23426
本文由主机测评网于2026-01-11发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260116775.html