你是否曾见过这样的新闻标题:「AI攻克人类五十年未解的数学难题,数学家面临失业危机!」这类标题充满了煽动性,让渴望见证AGI(通用人工智能)诞生的人们兴奋不已,却让坚守人类智力尊严的数学家们感到忧虑。
随着这些文章的影响力日益增大,终于有人站出来降温,这个人正是AI数学研究领域的积极推动者——陶哲轩。
陶哲轩并未否定AI的数学研究能力,他只是希望人们回归现实。今天凌晨,他在GitHub上发帖称,AI解决数学问题的能力被过分夸大了。
他在Erdős Problems项目相关的GitHub页面补充了更系统的说明与警示。他强调外界对AI解决Erdős问题的解读很容易过度,特别是将某个孤立战果当作「AI已具备高级数学能力」的证据。
那么,陶哲轩到底在澄清什么?AI在Erdős问题上究竟做到了什么程度?
首先要明确的是,陶哲轩并非否认AI在数学上的进步。他否定的是那种偷懒的叙事:将「AI在某些问题上能产出可验证结果」,偷换为「AI已经会做数学、能独立创新、能替代人类」。
在他更新的「AI contributions to Erdős problems」页面里表示,看AI在Erdős问题上的成绩单时,千万别只盯着「解了多少题」,还需特别注意以下几点:
题目难度悬殊,「解题数」无法直接比较:Erdős问题的难度跨度非常夸张,从公认的核心难题到长期无人研究的「长尾题」。后者中有不少属于「低垂果实」,更适合当前AI工具。但很难判断题目属于哪一类难度。因此,「谁解得多」可能并非同一难度段的对比。
许多题目「是否未解」本身就不确定:网站上的许多问题缺少系统文献回顾,「Open」(未解)这个标签可能只是暂定。AI解出一题后,大家很快发现原来文献里早有解答。
我们只看到成功案例,失败被隐藏:网站对AI工具的记录并不完整,尤其是失败的尝试。
有些题目原始表述有误,可能被「钻字面漏洞」解掉:极少数情况下,Erdős的题目表述可能不严谨,需要结合上下文和领域经验判断。
数学价值不仅在于答案,更在于「连接知识网络」:数学的意义在于证明成立及其对相关领域的启发。但AI主导的证明往往缺少这些知识背景。
解出冷门长尾题,不等于可投顶级期刊:并非每解一个未解题都等价于可发表论文。
形式化到Lean提高可信度,但仍可能被钻空子:形式化时可能引入额外公理或误形式化。
简单来说,陶哲轩认为AI在Erdős问题上的进展值得关注,但真正要看的是题目的难度层级、文献核查等更多维度的指标。
那现实里,AI到底做了什么?
陶哲轩的GitHub页面将AI贡献分为多个类别:生成完整(或部分)解答、参与文献检索、形式化到Lean等。
例如,页面列出#728问题在2026年1月6日由Aristotle与ChatGPT 5.2 Pro给出完整解答(Lean验证),#729问题在1月8-10日也获得完整解答(Lean验证)。这意味着在某些题型、某些难度区间,AI确实能做出「可运行的证明结构」,甚至进入形式化验证流程。
如果仅凭几个孤例就认为「AI数学无敌」,显然有些片面。但反过来,觉得AI做数学啥也不行,同样会错过它真正有价值的部分。
更准确的说法可能是:AI正在学会做数学的体力活和工程活:跑套路、补漏洞、做形式化等。而数学真正的「灵魂」——提出深刻问题、创造新概念等——仍然高度依赖人类。
所以,陶哲轩这次深夜发帖想要说的,正在于此。未来的数学家,或许不再是孤独的思考者,而是统领着硅基智能大军的指挥官。在那片广袤的数学原野上,人类指引方向,AI开路架桥。
别断章取义地神话AI,但也绝不要低估这股正在重塑真理探索方式的力量。
本文由主机测评网于2026-06-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260647897.html