数学天才陶哲轩与先进AI模型GPT-5 Pro强强联合,在微分几何领域取得惊人突破,成功解决了一个悬置三年之久的开放问题。
这一成就尤为引人注目,因为该问题“超出陶哲轩的常规研究范围”:它属于微分几何范畴,涉及流形与曲率的复杂性质。
陶哲轩的专长集中于分析、数论和组合学等领域,主要研究整数、函数和算子特性。而微分几何则聚焦于曲面和空间结构的性质,所用工具和方法大相径庭。
陶哲轩仅凭直觉提供了一个大致方向,GPT-5 Pro便从繁琐计算到严谨证明全程协助,帮助他捕捉关键逻辑,突破传统思维限制。
更有趣的是,在AI的辅助下,陶哲轩最终发现自己的初始直觉存在偏差,但通过这一过程更深刻地理解了问题本质。
这次跨界解题经历让陶哲轩对AI在学术研究中的角色有了新认识,他总结道:
AI在微观层面非常有效,在中观层面可能作用有限,但在宏观层面又具辅助价值。
问题的起源可追溯到三年前在mathoverflow上提出的一个开放问题:
考虑三维空间中一个光滑拓扑球面围成的区域,若曲面的主曲率绝对值不超过1,那么该区域所包围的体积是否至少等于单位球的体积?
陶哲轩最初思路是将问题限制在星形区域上,并借助积分不等式推进。但由于微分几何知识生疏,他请AI协助进行复杂计算。
GPT-5 Pro经过11分18秒的深入思考,不仅完成了所有计算,还直接给出了星形情况下的完整证明。
证明过程运用了多种不等式和恒等式,包括Stokes定理和Willmore不等式等陶哲轩熟悉的工具,以及他首次接触的Minkowski第一积分公式。
结合这些不等式和算术-几何平均不等式,星形情况的证明最终简化为一行论证。
至此,进展一切顺利。
接下来,陶哲轩需要验证证明的各个步骤,但网络资源有限。再次询问AI后,他获得了两个满意的证明:一个基于他建议的散度定理路线,另一个则采用他未曾想到的流方法。
通过AI的计算和证明,陶哲轩尝试将问题视为扰动椭圆偏微分方程问题,AI在这一思路上也表现良好。
尽管在估计扰动非线性项时出现了轻微错误,但问题可修复。AI还主动指出,一种特殊情况可回归到星形结果。
通过偏微分方程扰动理论,成功解决了曲面形状与单位球面接近时的情形。
然而,真正的挑战在于曲面形状与球面差异巨大时的问题。
陶哲轩意识到可将问题简化为大型有限计算,但AI基于此方法给出的结果混乱且缺乏启发性,本质上是对所有可能形状的穷举。
最终,陶哲轩发现他设想的数值方法或许能解决特定特殊情况,但无法处理一般情况,而AI仅机械执行了指令。
总而言之,虽然问题未完全解决,但在AI的辅助下,陶哲轩对问题的理解更加深入。
解题过程结束后,陶哲轩进行了深入思考。
回顾全程,AI在“小尺度”问题上表现优异,仅犯小错误,并贡献了一些陶哲轩未知但文献中已有的有用想法。
但要进一步推进问题,仍需真正的微分几何专家介入。
在“中等尺度”策略上,AI略显无益,它强化了陶哲轩的错误直觉而非提出质疑。
陶哲轩的初始直觉有误,AI未能发现问题,基本只是附和其观点。
但从“大尺度”理解问题的角度来看,AI仍有帮助,尽管是间接的:它使陶哲轩能更快探索并最终放弃一种不适用方法。
陶哲轩将此次经历与先前实验对比。
在以往实验中,他交给AI一项自己直觉较强的任务。彼时AI更具创造力,提供未知信息,但引导AI朝高效方向前进也更困难。
他认为,在专业领域外与AI互动确有价值,但需保持谨慎和清醒认知。
此经历也印证陶哲轩先前观点:必须在多尺度评估工具效能。
他曾提出四个效率尺度:形式化证明中的单行、单条引理、完整定理证明及整本教科书。
当前自动化工具或可在某一尺度加速形式化,但过度依赖可能削弱其他尺度的形式化能力。
他认为最优自动化水平严格介于0%与100%之间。
每个尺度需足够自动化以减少繁琐重复,但也要保留足够“人在回路中”以审查修复局部问题,使人类保持对所有尺度任务结构的感知。
若过度在单一尺度基准测试AI,可能对长期目标产生不利影响。
陶哲轩对AI辅助数学研究的探索可追溯到三年前——ChatGPT刚问世时。
他敏锐察觉其潜力,并就黎曼假设试探询问,结果令人失望:
ChatGPT的回答看似合理相关,但细究后缺乏实质深度。
当时的ChatGPT尚不能完全理解数学问题本质,仅是对低质内容进行包装掩盖,这意味着需人工筛查核心内容,如逐行阅读文本。
早期陶哲轩对AI工具持怀疑态度,认为其在数学中作用是为答案提供近似值,再由人类数学家逐步细化。
转机出现在GPT-4,陶哲轩尝试用它处理统计数据,如将原始数据输入电子表格并查找函数进行计算。
短短几分钟,GPT-4完成人类一天工作量,仅需少量校验。这让他期待将AI集成到软件工具中,尤其是处理LaTeX编译问题。
我可以明确地说,今天是GPT4为我节省大量繁琐工作的第一天。
随后,他用GPT-4处理熟悉领域的数学问题,如证明递归式能推导出a(n+1)。
GPT-4从合作者角度提出八种方法,其中生成函数法引起陶哲轩兴趣,他沿此路径人工计算最终解决问题。而最初他想用渐近分析方法,AI却更快协助找到正确方案。
同时,他让ChatGPT编写Python计算序列长度,结果虽与目标序列有差异,但已足够接近,且在计算totient函数时采用了独特方案。
但代码有时不够简洁高效或逻辑严密,仍需人工校正与重写。
他还尝试用Copilot书写数学论文,但在撰写证明大纲时,AI陷入长篇叙述随机分析数论的废话,仅在编写短或重复文本时有效。
因此,当时AI写数学论文有趣多于实用。
GPT-o1发布后,陶哲轩第一时间测试其数学能力。相比前代,GPT-o1幻觉问题改善,在形式化任务中作用显著,但在复杂分析问题上仍令人失望,未能产生关键概念思想。
陶哲轩将这一代定义为平庸但非无能的数学“研究生”,而此前模型更接近无能“研究生”水平。他相信再迭代一两次并结合其他工具,AI将在研究级任务中大放异彩。
今年七月,OpenAI在IMO夺金引发热议,陶哲轩长文回应,认为缺乏统一评测标准。
同时,他开始用ChatGPT处理更复杂数学问题,如在判断集合是否为HA子集时,陶哲轩理论分析已确定答案是否定的,但仍需数值参数验证不等式。
起初直接要求AI提供Python代码反例,但因参数问题失败。随后他调整策略,与AI逐步对话,使其执行启发式计算并找到可行参数,经单独验证后最终解决问题。
陶哲轩总结,在数值搜索类任务上,AI工具可大幅节省时间。若无AI,他可能不会考虑此法,转而寻求理论渐进分析。
为减少AI在数学问题中的幻觉或废话,陶哲轩总结出一套心得:在计算任务每一步详细解释,每次对话先确认再执行下一步,对话结束后用Python外部验证输出。
正如他一直强调,AI正在重塑人类科学范式,其最合理角色是成为数学家的“副驾驶”或助理,而非取代人类在创造性、直觉性和策略性上的工作。
在AI协助下,数学未来将拥有更多实验,而不仅仅是理论。
https://mathstodon.xyz/@tao/115351400633010670
[1]https://chatgpt.com/share/68e85cba-7228-800e-8804-a0f41aa64e14
[2]https://mathoverflow.net/questions/425509/sphere-with-bounded-curvature
[3]https://terrytao.wordpress.com/mastodon-posts/
本文由主机测评网于2026-01-07发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260115659.html