在短短48小时内,全球数学家与AI的梦幻联动破解了困扰数学界50年的难题——Erdos#1026问题,并给出了正式证明。
这次突破不仅令人惊叹,更是开创了数学研究的新纪元。
陶哲轩在Mastodon上自豪地宣布了这一壮举,并通过博客详细讲述了这一传奇故事。
他强调,在AI的助力下,人类团队仅用了不到两天的时间,就成功攻克了这一难题。并且,AI在此过程中展现出了全新的理解方式,而不仅仅是简单的文献检索。
若采用传统方法,仅依靠数学家使用编程和文献检索,可能需要数周甚至数月的时间。
在这个里程碑式的项目中,AI实际上是在生成新的数学洞见。
Harmonic官网也为此事欢呼,其AI系统Aristotle正是此次解题的关键参与者。
传奇数学家保罗·埃尔德什在1975年的一篇论文中提出了这个问题。半个世纪后,它静静地躺在「埃尔德什问题网站」上,编号为1026。
没想到,在2025年的最后一个月,这个问题被一群数学家利用AI工具,在短短两天内彻底破解。
埃尔德什的原问题,读起来像是个谜语。
给定一串不同的实数x1,x2,…,xn,定义S(x1,…,xn)为所有单调子序列(递增或递减)的最大可能和。这个函数有什么性质?
问题的表述让人困惑:是求S的表达式?还是找它和总和的比值下界?
当这个问题于2025年9月12日被挂上网站时,附加了一条注释:「该问题表述较为模糊。」但数学家的使命就是化模糊为精确。
当天,网友Desmond Weisenberg提出了一个清晰的游戏化解释:
Alice和Bob的硬币游戏
Alice有N枚硬币,她分成n堆,每堆xi枚(xi可不同)。Bob可以选取一个单调的子序列(递增或递减),拿走这些堆里所有硬币。问:无论Alice怎么分堆,Bob至少能拿到总硬币数的多少比例?这个比例,记作c(n)。
通过几个例子,我们可以更好地理解这个问题。
很快,Stijn Cambie发现:如果Alice把硬币分成k²堆,每堆差不多大,并排列成k个递减块,每块k堆,块之间递增,那么最长单调子序列只有k堆。于是Bob最多拿到1/k的比例,也即c(k²)≤1/k。
反过来,Wouter van Doorn用已有结果给出下限:c(n)≥(1/√2)/√n。那么,√n·c(n)的极限是多少?它在1/√2和1之间。
第二天,Stijn手算小n的值:
数据虽少,但已足够让他大胆猜想:c(k²)=1/k。这意味着√n·c(n)→1,Bob在n很大时几乎能保证拿到约1/√n的比例。
两个月后,Boris Alexeev用AI工具Aristotle在证明辅助语言Lean中自动证出了c(k²)=1/k。几乎同时,Koishi Chan给出了一个优美的人类证明——「膨胀法」。
至此,上下界合一,猜想成功得证。更巧的是,这个答案其实早就存在了。
但故事的高潮还在后面。陶哲轩决定用另一个AI工具AlphaEvolve系统探索c(n)。
本文由主机测评网于2026-05-26发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546249.html