当前位置：首页 > 科技资讯 > 正文

AI数学能力被高估？陶哲轩深夜澄清

你是否曾见过这样的新闻标题：「AI攻克人类五十年未解的数学难题，数学家面临失业危机！」这类标题充满了煽动性，让渴望见证AGI（通用人工智能）诞生的人们兴奋不已，却让坚守人类智力尊严的数学家们感到忧虑。

随着这些文章的影响力日益增大，终于有人站出来降温，这个人正是AI数学研究领域的积极推动者——陶哲轩。

陶哲轩并未否定AI的数学研究能力，他只是希望人们回归现实。今天凌晨，他在GitHub上发帖称，AI解决数学问题的能力被过分夸大了。

AI数学能力被高估？陶哲轩深夜澄清陶哲轩 AI 数学能力 Erdős问题第1张

他在Erdős Problems项目相关的GitHub页面补充了更系统的说明与警示。他强调外界对AI解决Erdős问题的解读很容易过度，特别是将某个孤立战果当作「AI已具备高级数学能力」的证据。

那么，陶哲轩到底在澄清什么？AI在Erdős问题上究竟做到了什么程度？

陶哲轩的深夜辟谣

首先要明确的是，陶哲轩并非否认AI在数学上的进步。他否定的是那种偷懒的叙事：将「AI在某些问题上能产出可验证结果」，偷换为「AI已经会做数学、能独立创新、能替代人类」。

在他更新的「AI contributions to Erdős problems」页面里表示，看AI在Erdős问题上的成绩单时，千万别只盯着「解了多少题」，还需特别注意以下几点：

题目难度悬殊，「解题数」无法直接比较：Erdős问题的难度跨度非常夸张，从公认的核心难题到长期无人研究的「长尾题」。后者中有不少属于「低垂果实」，更适合当前AI工具。但很难判断题目属于哪一类难度。因此，「谁解得多」可能并非同一难度段的对比。

许多题目「是否未解」本身就不确定：网站上的许多问题缺少系统文献回顾，「Open」（未解）这个标签可能只是暂定。AI解出一题后，大家很快发现原来文献里早有解答。

我们只看到成功案例，失败被隐藏：网站对AI工具的记录并不完整，尤其是失败的尝试。

有些题目原始表述有误，可能被「钻字面漏洞」解掉：极少数情况下，Erdős的题目表述可能不严谨，需要结合上下文和领域经验判断。

数学价值不仅在于答案，更在于「连接知识网络」：数学的意义在于证明成立及其对相关领域的启发。但AI主导的证明往往缺少这些知识背景。

解出冷门长尾题，不等于可投顶级期刊：并非每解一个未解题都等价于可发表论文。

形式化到Lean提高可信度，但仍可能被钻空子：形式化时可能引入额外公理或误形式化。

简单来说，陶哲轩认为AI在Erdős问题上的进展值得关注，但真正要看的是题目的难度层级、文献核查等更多维度的指标。

那现实里，AI到底做了什么？

陶哲轩的GitHub页面将AI贡献分为多个类别：生成完整（或部分）解答、参与文献检索、形式化到Lean等。

例如，页面列出#728问题在2026年1月6日由Aristotle与ChatGPT 5.2 Pro给出完整解答（Lean验证），#729问题在1月8-10日也获得完整解答（Lean验证）。这意味着在某些题型、某些难度区间，AI确实能做出「可运行的证明结构」，甚至进入形式化验证流程。

如果仅凭几个孤例就认为「AI数学无敌」，显然有些片面。但反过来，觉得AI做数学啥也不行，同样会错过它真正有价值的部分。

更准确的说法可能是：AI正在学会做数学的体力活和工程活：跑套路、补漏洞、做形式化等。而数学真正的「灵魂」——提出深刻问题、创造新概念等——仍然高度依赖人类。

所以，陶哲轩这次深夜发帖想要说的，正在于此。未来的数学家，或许不再是孤独的思考者，而是统领着硅基智能大军的指挥官。在那片广袤的数学原野上，人类指引方向，AI开路架桥。

别断章取义地神话AI，但也绝不要低估这股正在重塑真理探索方式的力量。

本文由主机测评网于2026-06-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260647897.html