当前位置:首页 > 科技资讯 > 正文

AI危险之处:错得太像对,难辨真伪

AI危险之处:错得太像对,难辨真伪 AI  陶哲轩 验证 模仿 第1张

在最近播出的一期播客节目中,菲尔兹奖得主陶哲轩谈及了AI的危险之处:它最可怕的地方,不在于它做不到,而是它错得太像对。

AI能写出一篇看似无懈可击的推理,逻辑严密,术语齐全,语气坚定。你一读,就有些相信了。

但问题是:你无法确认它是不是真的对。

为什么它会这么说?如果错了,谁能看出来?能否被复现、被验收?

这些基本问题,是AI一落地就会遇到的挑战。这不仅仅是技术问题,更是责任问题。陶哲轩从三个层面剖析了这个问题:AI如何模仿、为何缺乏判断、以及为何难以验证。

他的结论是:当AI的输出越来越像真的,验证它没错的能力,才是真正稀缺的。

这篇文章围绕一个核心问题展开:你是否有能力确认AI没有错误?

第一节:模仿|AI在复制思维的表象

陶哲轩指出,目前的AI在做数学时,看似无所不能,实际上却不知道自己正在做什么。

它能写出一篇看似像证明的内容,有定理、有步骤、有“所以”,语气自然。

但如果你深入追问一句:你为什么这么写?

他会说,AI给出的答案完全是逻辑不通(complete nonsense)。显然,它根本不知道自己在说什么。

这种AI更像是一个紧张的学生,在黑板前快速拼凑训练时见过的内容,但他自己并不理解这个推理是否合理。

更麻烦的是,你很难确认AI是真正推导出来的,还是仅仅在复述训练数据。

陶哲轩称之为“Contamination”(数据污染):教科书里的定理、例题,AI在训练时都见过。它可能只是在重复训练时见过的内容,而不是在思考。这也是目前大模型在专业领域的一个普遍问题:它很会模仿,但不具备判断力。

人类在做数学题时,会有基本的直觉。但AI没有。它是从海量语料中,找到最可能出现的句子接着往下写。它输出的不是逻辑,而是统计概率。

这导致了一个危险的后果:这些模型说得越像人、表达越自然,我们越容易下意识相信它是对的,而不去查每一步推理是否真的成立。

第二节:动机|AI说不清为何这么做

“那它为什么能错得这么像?”

在陶哲轩看来,AI在数学中的表现,不仅仅是缺乏逻辑,更严重的是它对问题本身没有理解。

一个真正懂数学的人,面对一个新问题时,首先会想到的是:

这个问题值不值得解?它跟哪些已知知识有关?有没有什么有趣的定理或公式可以利用?

而AI没有这种判断。

它写出某个定理,不是因为它知道这个定理在证明中起关键作用,而是因为它见过这样的证明,就照着写。

陶哲轩强调,AI不具备价值判断,它不知道这件事为什么重要,也不知道哪些问题更值得解决。数学世界里最难的从来不是怎么做,而是做什么。

第三节:验证|AI写的东西过不了检查

就算AI知道该做什么,还有一个更致命的问题:它写出来的东西,往往过不了检查。

在数学里,答案只是起点,真正重要的,是你怎么一步步推出来的。

一个结论成立,不是因为它听起来合理,而是因为它可以被检查、被追溯、被验证。

  • 律师用AI生成法律文书,发现引用的判例根本不存在。据报道,有律师因为没验证AI生成的案例引用,在法庭上被当场拆穿,最后被罚款。
  • 程序员用AI写代码,看起来能跑,但埋了安全漏洞。没仔细审查就上线,等发现时损失已经造成。
  • 金融分析师用AI生成投资报告,数据来源、计算逻辑都说不清楚。你敢拿这个给客户做决策吗?

问题的核心都一样:AI给你一个“看起来对”的结果,但你很难验证每一步是否站得住脚。

只在你能验证的范围内使用AI。

也就是说,不是不用AI,而是必须把AI和验证工具配对使用。AI负责生成,人类或自动验证系统负责检查。超出验证能力的部分,不要碰。

结语|它不是会做数学,是在表演“会”

AI危险之处:错得太像对,难辨真伪 AI  陶哲轩 验证 模仿 第2张

AI危险之处:错得太像对,难辨真伪 AI  陶哲轩 验证 模仿 第3张

AI危险之处:错得太像对,难辨真伪 AI  陶哲轩 验证 模仿 第4张

AI危险之处:错得太像对,难辨真伪 AI  陶哲轩 验证 模仿 第5张

AI危险之处:错得太像对,难辨真伪 AI  陶哲轩 验证 模仿 第6张

AI最危险的并不是它不会做什么,而是它表现得像会做什么。

它能写出看似完整的推理,但说不清为什么;它能复述训练数据里的内容,但判断不了重要性;它能排列出推理的格式,但经不起逐步检查。

你很难从表面判断:它是真懂还是在照搬?是在推理还是在东拼西凑?

参考资料: