随着AI技术的不断进步,科研领域的效率正迎来前所未有的提升。
近日,谷歌发布了一项重大成果,介绍了一个能够协助科研人员编写「专家级」科研软件的AI系统。
该系统将大语言模型与传统树搜索巧妙结合,能够自动生成并优化科研所需软件程序,从多种渠道获取现有知识,并整合重组这些知识以形成新的研究思路。
据谷歌介绍,该系统不仅达到了专家水平,而且在某些情况下甚至超越了人类的表现。在基因组学、公共健康、数值分析等多个领域,该系统的表现甚至超过了顶尖研究团队和国家级集成系统。
论文标题:An AI system to help scientists write expert-level empirical software
论文链接:点击这里
该AI系统的应用使得科研人员能够在各个领域中更高效地构建研究思路和实证程序,从而加速科学研究的进程。
AI在科研领域的应用以其自动化特性著称,能够辅助科研人员完成重复性高、强度大的工作,减少在验证和调试程序上的时间浪费,并激发科研人员的创新思维。
谷歌的这一系统通过整合与重组研究思路,能够在科研任务中创建新策略,构建更高效模型,使AI系统深度介入科研领域的创新过程,从一次性代码生成工具转变为由量化目标指导的迭代、搜索驱动的软件演进。
然而,也有网友对AI深入科研领域表示担忧:
尽管谷歌的AI系统展现出巨大潜力,但它仍存在局限性。该系统主要针对「可评分的科学任务」,即那些可以通过准确率、误差率等指标量化软件性能的计算问题。尽管它覆盖了广泛的科研领域,但并未提及那些无法量化评估的任务表现。
值得一提的是,前谷歌搜索成员Deedy Das对该工作表示了极大兴趣,特别是论文附录中的Prompt。
论文中使用的指令:「请创建一种算法,结合两种策略的优点,形成一种真正出色的混合策略,并且其得分要高于任一单独策略。」这表明优秀的结果并不一定需要非常复杂的Prompt指令。
论文详细内容如下:
本研究引入了一个AI系统,该系统能自动为科学计算任务创建专家级的实证软件。该系统结合了大型语言模型和树搜索算法,以迭代地生成、评估和完善科学软件解决方案。其核心创新在于,LLM不仅用于一次性代码生成,而是作为系统搜索过程中一个智能的「变异」引擎,能够整合并重组科学文献中的研究思路。
图 1: (a) 系统架构:展示了可评分问题与研究思路如何输入到大语言模型(LLM),由其生成代码,并在沙盒环境中进行评估,结果以树搜索结构进行组织。(b) 性能对比:不同方法的成功率比较,结果显示结合专家指导的树搜索(TS)取得了最高成功率。(c) 研究思路来源:包括专家知识、学术论文,以及AI生成的重组方案。
本系统的目标是「可评分的科学任务」,即那些可以通过准确率、误差率等指标量化软件性能的计算问题。这类任务涵盖了从基因组学到图像分析等广泛的科学计算应用。
该方法论围绕三个核心组件协同工作:
一个关键的创新是研究思路的系统集成及其智能重组。该系统能够分析不同方法的核心原理,并合成创建混合方法的指令。
这项研究表明,AI不仅能够实现自动化,还能在多个科学领域系统性地超越人类在科研软件开发中的表现。系统在多个领域中持续取得专家级甚至超越人类水准的成果,显示出其广泛的适用性。
本文由主机测评网于2026-04-28发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260441097.html