非营利研究机构FutureHouse近期发布了一款名为“科斯莫斯”(Kosmos)的AI超级科学家系统,该系统在单次运行12小时即可实现相当于人类研究员团队半年科研工作的成果。 OpenAI首席执行官山姆·奥特曼对这一突破表示高度赞赏,称:“这令人非常兴奋!我预计我们将看到更多类似项目,这将是人工智能的重要应用方向之一。” 与早期开发的AI科学家“罗宾”相比,科斯莫斯在处理海量信息方面表现更为出色。得益于“结构化世界模型”的创新架构,该系统能够高效融合来自数百个智能体轨迹的信息,即使在处理数千万token规模的庞大数据时,也能保持与核心研究目标的高度一致。 图:AI超级科学家科斯莫斯的运行原理 科斯莫斯采用自主循环工作架构,能够并行启动文献检索与数据分析任务,持续更新内部知识图谱,并智能规划下一轮探索方向。据统计,单次运行平均完成166轮数据分析和36次文献综述迭代,所有结论均能追溯到具体的代码片段或原文出处,支持完整审计验证。 在持续运行12小时,该系统能够阅读1500篇学术论文,生成并执行4.2万行分析代码,并输出完整可溯源的科研报告,其综合处理能力已超越目前已知的所有智能体系统。 图:科斯莫斯单次运行可阅读1500篇论文、生成4.2万行代码 在实际测试中,科斯莫斯展现出远超前代系统的分析效能。参与评估的研究人员普遍反馈,该系统半天内完成的工作量,相当于他们个人六个月的研究投入,且输出结论的准确率达到79.4%。 FutureHouse已经启动科斯莫斯的商业化运营,单次运行定价约200美元,并为学术用户提供免费额度。 科斯莫斯已在神经科学、材料科学、统计遗传学等多个前沿领域取得了七项具有实质意义的发现。其中,独立复现三项尚未发表的研究,包括确认核苷酸代谢为低温脑处理关键通路,并发现钙钛矿太阳能电池在绝对湿度高于60g/m³时失效的阈值。 科斯莫斯并非传统意义上的对话式AI,而是一个需要深度交互的科研平台。用户需掌握结构化提示技巧,通过明确的研究目标设定、数据路径规划与分析框架定义,才能充分发挥其效能。 研究人员发现:单次运行完成的工作量,相当于一名博士或博士后研究人员六个月的研究产出。这种效能随着运行深度的增加呈线性增长,为FutureHouse提供了首个“科研任务推理时间缩放定律”的实证。 图:科斯莫斯运行12小时可完成人类专家半年工作量 在科斯莫斯发布后,网友纷纷对其超能力点赞,称其为“人工智能应用最恰当的典范”。
高效运行:12小时顶人类半年工作量,准确率高达79.4%
七大发现:复现三大试验与四大创新
解锁AI科研新范式:从对话工具到深度研究伙伴
效能验证:从“六个月”到科研新标准
网友热议:AI应用最恰当的典范
本文由主机测评网于2026-05-11发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260544625.html