
在最近播出的一期播客节目中,菲尔兹奖得主陶哲轩谈及了AI的危险之处:它最可怕的地方,不在于它做不到,而是它错得太像对。
AI能写出一篇看似无懈可击的推理,逻辑严密,术语齐全,语气坚定。你一读,就有些相信了。
但问题是:你无法确认它是不是真的对。
为什么它会这么说?如果错了,谁能看出来?能否被复现、被验收?
这些基本问题,是AI一落地就会遇到的挑战。这不仅仅是技术问题,更是责任问题。陶哲轩从三个层面剖析了这个问题:AI如何模仿、为何缺乏判断、以及为何难以验证。
他的结论是:当AI的输出越来越像真的,验证它没错的能力,才是真正稀缺的。
这篇文章围绕一个核心问题展开:你是否有能力确认AI没有错误?
陶哲轩指出,目前的AI在做数学时,看似无所不能,实际上却不知道自己正在做什么。
它能写出一篇看似像证明的内容,有定理、有步骤、有“所以”,语气自然。
但如果你深入追问一句:你为什么这么写?
他会说,AI给出的答案完全是逻辑不通(complete nonsense)。显然,它根本不知道自己在说什么。
这种AI更像是一个紧张的学生,在黑板前快速拼凑训练时见过的内容,但他自己并不理解这个推理是否合理。
更麻烦的是,你很难确认AI是真正推导出来的,还是仅仅在复述训练数据。
陶哲轩称之为“Contamination”(数据污染):教科书里的定理、例题,AI在训练时都见过。它可能只是在重复训练时见过的内容,而不是在思考。这也是目前大模型在专业领域的一个普遍问题:它很会模仿,但不具备判断力。
人类在做数学题时,会有基本的直觉。但AI没有。它是从海量语料中,找到最可能出现的句子接着往下写。它输出的不是逻辑,而是统计概率。
这导致了一个危险的后果:这些模型说得越像人、表达越自然,我们越容易下意识相信它是对的,而不去查每一步推理是否真的成立。
“那它为什么能错得这么像?”
在陶哲轩看来,AI在数学中的表现,不仅仅是缺乏逻辑,更严重的是它对问题本身没有理解。
一个真正懂数学的人,面对一个新问题时,首先会想到的是:
这个问题值不值得解?它跟哪些已知知识有关?有没有什么有趣的定理或公式可以利用?
而AI没有这种判断。
它写出某个定理,不是因为它知道这个定理在证明中起关键作用,而是因为它见过这样的证明,就照着写。
陶哲轩强调,AI不具备价值判断,它不知道这件事为什么重要,也不知道哪些问题更值得解决。数学世界里最难的从来不是怎么做,而是做什么。
就算AI知道该做什么,还有一个更致命的问题:它写出来的东西,往往过不了检查。
在数学里,答案只是起点,真正重要的,是你怎么一步步推出来的。
一个结论成立,不是因为它听起来合理,而是因为它可以被检查、被追溯、被验证。
问题的核心都一样:AI给你一个“看起来对”的结果,但你很难验证每一步是否站得住脚。
只在你能验证的范围内使用AI。
也就是说,不是不用AI,而是必须把AI和验证工具配对使用。AI负责生成,人类或自动验证系统负责检查。超出验证能力的部分,不要碰。





AI最危险的并不是它不会做什么,而是它表现得像会做什么。
它能写出看似完整的推理,但说不清为什么;它能复述训练数据里的内容,但判断不了重要性;它能排列出推理的格式,但经不起逐步检查。
你很难从表面判断:它是真懂还是在照搬?是在推理还是在东拼西凑?
本文由主机测评网于2026-06-05发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260647414.html