当前位置:首页 > 科技资讯 > 正文

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026

在短短48小时内,一个沉淀了50年的数学谜题迎刃而解!人工智能与全球数学家展开梦幻合作,从硬币分配游戏到正方形填充问题,层层深入解析埃尔德什遗留挑战,这种人机协作模式彻底引爆了数学研究新范式。

近日,人工智能再次突破,成功解决了一个长期未解的数学难题!

埃尔德什编号1026的问题已被完全攻克,并给出了正式证明。

在此之前,这个难题已经困扰数学界长达半个世纪。

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第1张

著名数学家陶哲轩在Mastodon上宣布了这一消息,并在博客中详细讲述了这个故事。

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第2张

他强调,在AI的辅助下,人类团队仅用48小时就顺利攻克了这一难题,AI带来了全新理解,绝非简单搜索。

传统方法依赖数学家编程和文献检索,可能需要数周甚至数月,而AI在此过程中生成新的数学洞见,而非仅检索现有文献。

Harmonic官网也宣布了这一消息,其AI系统Aristotle参与了此次解题过程。

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第3张

Erdos#1026问题

1975年,传奇数学家保罗·埃尔德什在一篇论文的角落随手写下这个问题。

半个世纪后,它静静躺在「埃尔德什问题网站」上,编号1026,直到2025年末被一群数学家利用AI工具在48小时内彻底破解。

埃尔德什的原问题读起来像谜语:给定一串不同的实数x1,x2,…,xn,定义S(x1,…,xn)为所有单调子序列(递增或递减)的最大可能和。这个函数有什么性质?

问题表述模糊,但数学家本能地将其精确化。2025年9月12日,网友Desmond Weisenberg提出游戏化解释:Alice和Bob的硬币游戏。

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第4张

Alice有N枚硬币,分成n堆,每堆xi枚(xi可不同)。Bob选取一个单调子序列(递增或递减),拿走这些堆里所有硬币。问:无论Alice怎么分堆,Bob至少能拿到总硬币数的多少比例?这个比例记作c(n)。

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第5张

从n=3到平方数猜想

通过具体例子探索,Stijn Cambie发现:如果Alice把硬币分成k²堆,每堆大小相近,排列成k个递减块,每块k堆,块之间递增,那么最长单调子序列只有k堆,Bob最多拿到1/k的比例,即c(k²)≤1/k。

反过来,Wouter van Doorn用已有结果给出下限:c(n)≥(1/√2)/√n。因此,√n·c(n)的极限在1/√2和1之间。

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第6张

第二天,Stijn手算小n的值,数据虽少但足以让他猜想:c(k²)=1/k,这意味着√n·c(n)→1,Bob在n很大时能保证拿到约1/√n的比例。

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第7张

AI出手了!

2025年12月7日,Boris Alexeev用AI工具Aristotle在Lean中自动证出c(k²)=1/k。几乎同时,Koishi Chan给出优美的人类证明——“膨胀法”。

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第8张

更巧的是,Google Scholar找到一篇2016年论文已有此结果,并引用了更早的Wagner用“膨胀法”处理埃尔德什-塞凯赖斯定理的工作,数学早已悄悄解决过这个问题。

AI登场,猜出完整公式

陶哲轩用另一个AI工具AlphaEvolve系统探索c(n),让AI尝试构造使S尽量小的序列,得到n=1到16的数值结果。

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第9张

这些分数看似杂乱,但重新排列后模式浮现。

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第10张 AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第11张

Boris提炼出干净公式,并构造出极值序列:用“红”“蓝”两种数值的块交替排列,控制单调子序列的长度。

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第12张

下图直观展示了该构造(a≥0的情形):

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第13张

而1/c(n)的图像,正是对√n的分段线性逼近:

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第14张

连接经典正方形填充问题

随后,Lawrence Wu指出:此问题等价于一个正方形填充问题(埃尔德什问题106)。

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第15张

Lawrence证明:c(n)≥1/f(n)。理由:对任意序列,可构造一系列正方形,它们互不重叠地填满边长为S(x1,…,xn)的大正方形。

下图展示了从AlphaEvolve给出的一个序列构造出的正方形填充。

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第16张

最后一击,文献中的完整解

Lawrence再用AI深度搜索,找到了2024年Baek、Koizumi、Ueoro的论文,其中证明:f(k²+2c+1)≤k+c/k。结合Praton的嵌入论证,这恰好给出:c(k²+2a+1)≤k/(k²+a)。上下界再次吻合,猜想完全得证!

AI+人类,48小时极限突围

这个故事最让陶哲轩触动的是,能汇聚一群不同背景的人、文献和工具来攻克问题至关重要。他感慨:传统模式下,一两位数学家凭借简单工具,或许最终也能拼出全貌,但那可能需要数周甚至数月。而在这个协作网络中,所有关键环节在48小时内汇聚。

要陈述并证明c(n)的精确公式,需要基于多个观察结果,包括:序列可数值计算为有理数序列;归一化后出现规律;问题是埃尔德什-塞凯赖斯定理的加权版本;其证明可解释为离散矩形填充论证;问题可重新解释为连续正方形填充问题,与埃尔德什问题106密切相关;后者轴平行形式最近被Baek-Koizumi-Ueoro解决;Praton的论文表明埃尔德什问题106蕴含了广义版本。

正是靠着所有贡献者的通力合作以及他们使用的工具,所有这些关键线索才得以在48小时内汇集。如果换作传统模式,过程会花长得多的时间。

另一个关键因素是Erdős问题网站上“平衡的AI政策”,它鼓励公开说明AI的使用情况,同时强烈反对隐瞒——允许使用AI辅助编写评论,前提是:公开说明;内容由用户自己核查;评论篇幅合理。

AI与数学家联手:48小时攻克50年数学谜题Erdos#1026 AI数学破解 埃尔德什问题 人机协作 正方形填充 第17张

一道悬置50年的问题,在2025年的冬天,因为一次跨人机、跨时空的奇妙协作,终于画上了圆满句号。而这,可能只是一个新时代的开始。

参考资料:ZHB

https://terrytao.wordpress.com/2025/12/08/the-story-of-erdos-problem-126/