当前位置:首页 > 科技资讯 > 正文

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具

著名数学家陶哲轩近日再次积极推广AlphaEvolve,强调其在数学研究领域的变革潜力。

在与DeepMind高级工程师Bogdan Georgiev等合作者共同发表的最新论文中,陶哲轩赞誉AlphaEvolve为数学探索的强大新工具

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第1张

具体而言,研究团队利用AlphaEvolve深入分析了67个数学问题,覆盖组合数学、几何、数学分析与数论等多个分支领域。

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第2张

结果显示,AlphaEvolve在可扩展性、鲁棒性和可解释性方面均显著优于传统数学工具。

更重要的是,AlphaEvolve已能自主发现新颖的数学构造,并在部分问题上超越人类已知的最优结果。

AI自主发现新数学构造

在67个问题的测试中,AlphaEvolve不仅复现了众多已知最优解,还展现了其独特的发现能力。

一个关键成就是AlphaEvolve能够自主发现人类未曾触及的新数学构造

例如在处理Nikodym集问题时,系统生成的初步构造虽未达最优,但为研究人员提供了“一个极好的人类直觉跳板”。

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第3张

基于AI提供的结构,研究人员通过人工简化和直觉推演,最终找到了更优构造,改进了已知上界,这一人机协作成果将作为独立论文发表。

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第4张

同样地,在算术Kakeya猜想中,AlphaEvolve也发挥了类似作用。

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第5张

系统不仅将已知下界从1.61226提升至1.668,其构造的解(形态类似离散高斯分布)还启发人类数学家建立了新渐近关系,相关成果也即将发表。

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第6张

这种启发人类研究的能力,与AlphaEvolve输出结果的可解释性紧密相关。

系统在大多数情况下生成结构清晰的程序代码,而非黑盒结果,使人类专家可方便分析、归纳模式,并提炼通用数学公式。

积木堆叠问题便是这一特性的绝佳体现。

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第7张

在该问题中,系统最初生成了一个逻辑正确的递归程序来计算积木放置。在随后的演化中,系统内部的LLM分析了这段代码逻辑,并自主将其重构为更简洁、高效的显式程序。

这个最终程序清晰地揭示了最优解与谐波数(harmonic numbers)之间的数学关系,这与人类已知的理论公式完全一致,展示了系统从复杂解法中提炼数学本质的能力。

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第8张

除了方案的清晰性,AlphaEvolve在不同类型的问题设置下也表现出了强大的鲁棒性。

它能够有效处理高维度参数空间、复杂几何约束以及基于蒙特卡洛模拟的近似评分函数。

比如这里有一个最小三角形密度问题。

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第9张

研究人员最初设计了一个朴素的评分函数,但系统很快利用了该问题空间的非凸性,通过“欺骗”评分函数获得了超越理论最优的不可能分数。

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第10张

为了解决这个问题,研究人员设计了一个更鲁棒的新评分函数,该函数基于问题的利普希茨连续性(Lipschitz type bounds)构造。

在切换到这个更复杂的连续评分函数后,AlphaEvolve不再受局部陷阱的迷惑,迅速收敛到了已知的、正确的理论最优解。

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第11张

并且AlphaEvolve具备了出色的泛化能力,来看IMO 2025的第6题。

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第12张

研究人员只在输入n为完全平方数时才对系统进行评分。这种“信息限制”反而迫使AlphaEvolve去寻找这些稀疏实例背后的共同结构模式,而不是对每个n进行“过拟合”。

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第13张

最终,系统成功发现并输出了在所有完全平方数n上均达到最优的通用构造,展现出了归纳能力。

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第14张

在实际应用中,AlphaEvolve效率极高,仅需少量高质量提示即可驱动。论文指出,来自领域专家的提示(expert guidance)往往能显著提升最终构造的质量,表明系统对人类输入具有高度敏感性。

同时,该系统在架构上支持并行化,允许研究人员在多个问题实例或同一问题的不同参数设置上同时运行探索,并能自动迁移成功的搜索策略,这在处理多参数的几何类问题时尤其高效。

AlphaEvolve工作模式

AlphaEvolve并非单一流程系统,而是通过不同“工作模式”适应各类数学问题探索任务。

该系统主要在两种不同模式下运行——“搜索模式”(search mode)和“泛化模式”(generalizer mode)。

“搜索模式”是系统最常用模式,其目标是高效发现最优数学构造,而不必关心构造过程是否具有可解释性或普适性。在这种模式下,AlphaEvolve演化的不是直接生成构造的程序,而是演化用于搜索构造的程序。

每一个被演化的程序本身就是一个“搜索启发式算法”(search heuristic)。

评估器会给予这些启发式算法一个固定时间预算,算法的得分取决于它在此预算内能找到的最佳构造的质量。

这种方式解决了LLM调用(缓慢且昂贵)与传统局部搜索(快速且廉价)之间的速度差异——一次缓慢的LLM调用用于生成一个高效搜索策略,该策略随后可以触发大规模的廉价计算,自主探索数百万个候选构造。

系统演化的是一系列“改进器”(improver)函数,它们动态适应搜索进程,早期可能偏好广泛探索的启发式算法,而当接近最优解时,则会演化出更精细的、针对特定问题进行优化的算法。

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第15张

“泛化模式”则更具挑战性。

其目标是让AlphaEvolve编写一个能够解决任意给定参数n的问题的通用程序。系统的评估方式是考察该程序在一系列不同n值上的综合表现。

这种模式的期望是,通过让系统观察自己在小规模n上找到的最优解,它能够自主“发现模式”,并将其归纳推广为一个适用于所有n的通用公式或算法。

AlphaEvolve:AI驱动数学发现,陶哲轩团队展示突破性工具 AlphaEvolve  数学发现 人工智能 人机协作 第16张

总之,AlphaEvolve展示了AI引导的演化搜索如何补充人类的直觉,为数学研究提供了一个强大的新范式。

论文地址:https://arxiv.org/abs/2511.02864