GPT-5震撼通过「哥德尔测试」,连破三大组合优化难题!甚至,它能自主推翻原有猜想,给出全新解法,令OpenAI研究科学家震惊不已。
AI迎来历史时刻!
GPT-5成功破解三大猜想,通过了「哥德尔测试」。
OpenAI科学家Sebastien Bubeck表示,这类开放性问题,顶尖博士生往往耗费数日才能解决。
不同以往,这项由海法大学和思科主导的研究,首次让AI直面「开放性数学猜想」的挑战。
论文地址:https://arxiv.org/pdf/2509.18383
论文中,团队设计了五项「组合优化」领域的测试任务,每项任务提供1-2篇文献作为参考。
在三个相对简单的问题上,GPT-5给出了近乎完美的解法,展现了其强大的逻辑推理能力。
令人惊喜的是,在猜想二中,它不仅成功求解,还推导出与研究人员预期不同的有效解法,颠覆了原有猜想。
这一突破,标志着顶尖AI正从「学习数学」迈向「真正做数学」的关键跨越。
不难看出,AI正为数学发现做出实质性贡献,提前预演了2030年代科研范式的深远变革。
此前,陶哲轩曾分享了自己与OpenAI o1的合作经验,将其比作「指导一名平庸但并非完全无能的研究生」。
在他看来,LLM虽能在大量提示后逐步得出解决方案,但无法独立生成关键概念性想法。
不过,经过一两次迭代,结合工具,AI就能达到「合格研究生」的水平。
OpenAI和谷歌均宣称,自家前沿LLM无需外部工具即可拿下IMO金牌。
但这个具有挑战性的问题,毕竟是为高中生设计的。
在最新论文中,研究焦点不同:让AI处理更高级的数学猜想,即「哥德尔测试」。
这些猜想要求的不只是解题能力,还需要整合背景知识和创新思维。
为此,研究人员从「组合数学」的子领域——子模最大化中挑选问题。这类问题具体、有明确动机,且控制在能展示数学推理范围内。
与陶哲轩实验不同,团队没有提供大量提示或指导。
论文中,他们精心设计了五大猜想。
只给每个问题一个最小化描述,外加1-2篇参考文献。
难度设定为:优秀本科生、研究生有望在一天内解决所有问题,同时确保大部分问题存在明确猜想及已知解决路径。
GPT-5的任务是,基于有限输入生成完整证明。
这模拟了真实研究场景:数学家往往从少量线索出发,独立探索。
这个要求似乎是让「两个互相掣肘的收益」加在一起最大化:
一部分收益G会越加东西越大(单调),另一部分H可能先涨后跌(非单调),而选择必须落在一个「不能超过上限」的凸集合里。
本文由主机测评网于2026-05-01发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260541914.html