大模型真的等同于奥数金牌生的水平吗?陶哲轩指出:必须明确并管理AI研究中的隐性目标。同时,香港大学马毅教授团队发布的GAUSS框架,通过三大领域、十二项技能对AI进行数学体检,不仅关注答案的正确性,更深入挖掘推理、学习与创造力的短板。
陶哲轩近期频频吐槽科研经费短缺,甚至需要抽出时间筹款。
尽管如此,作为当代最杰出的数学家之一,他并未停止研究探索。
最近,他在一篇博客中犀利地指出了当前AI数学研究中的一个核心问题——
AI能够解决研究中的显性目标,但我们也需要关注其带来的隐形代价。
数学家们的研究项目通常有一个终极目标,比如:「年底前,完成对数学定理X的证明。」
然而,这个终极目标背后,还隐藏着一些看不见、摸不着,却同样重要的东西。
比如,希望通过这个项目:
为开源数学库Mathlib贡献可复用的代码;
让新手成长为专家;
在严谨的证明过程中,深化对定理X的理解;
希望凝聚一个充满活力、热爱钻研的学术社区。
这些,就是项目中的「隐性目标」。
在深入理解陶哲轩的观点之前,我们先来了解他在博文中提到的经济学定律——Goodhart定律(Goodhart's law)。
陶哲轩没有将矛头指向AI本身,而是提醒我们——项目的设计者和管理者。
他提醒我们,在AI日益强大的今天,不能再依赖过去的默契。
必须更努力地审视、挖掘、明确那些曾经「理所当然」的隐性目标。
好消息是,陶哲轩的担忧正被越来越多的数学家们看到。
更重要的是,他们中的一些杰出代表已经给出了一些解决方案。
本文由主机测评网于2026-04-29发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260441327.html