GPT-5正在彻底改变科学研究的规则!一篇重磅论文披露,「量子版本的NP难题」竟被GPT-5在30分钟内成功解决,而这通常需要人类耗费1至2周时间。按照这种加速趋势,人工智能实现「诺贝尔奖级」科学突破已不再遥远。
近日,GPT-5率先通过「哥德尔测试」,并破解了数学领域的三大猜想,展现了其强大推理能力。
出人意料的是,GPT-5再次突破,在量子计算领域取得里程碑式进展。
量子计算权威专家Scott Aaronson首次发表论文,证实一个长期悬而未决的难题在GPT-5的辅助下被破解。
论文中,Scott深入研究了量子计算的核心问题——QMA复杂度类别,这被视为「量子领域的NP问题」。
关键点在于证明过程中的误差概率能否无限降低,尤其是实现完美完备性。
论文地址:https://arxiv.org/pdf/2509.21131
此前学术界已将误差压至极低水平,但最新研究发现:「双指数级误差」是现有方法的理论极限,无法进一步突破。
在推导关键步骤受阻后,作者向GPT-5寻求帮助。起初,AI提供了错误思路。
但经过约30分钟交互,GPT-5最终提出一个精妙的数学函数,精确分析了特征值行为。
研究证明,这一构想成为论文中最关键的突破点。
在最新博文中,Scott赞叹道,「这思路若出自学生之口,我定会称赞——绝妙至极」!
该难题预估需要人类研究人员1-2周时间才能完成
OpenAI科学家Sebastien和产品负责人Kevin激动转发,称「一场重大变革已拉开序幕」。
这篇于25日提交至arXiv的论文,重点研究了量子复杂性类「QMA中黑盒放大的局限性」。
那么,QMA究竟是什么?
QMA,即量子梅林-亚瑟(Quantum Merlin Arthur),可视为NP问题的典型量子版本。
它包含一类决策问题:
如果答案为「是」,Merlin可向Arthur发送一个量子见证态,使Arthur(经多项式时间量子计算后)以至少2/3概率接受;
如果答案为「否」,无论Merlin发送何种见证态,Arthur接受概率至多为1/3。
在复杂性理论中,常数2/3和1/3仅为惯例,可通过放大替换为如1-2⁻ⁿ和2⁻ⁿ等其他值。
该领域一个长期未解的问题是——
QMA是否等于QMA₁,其中QMA₁是QMA的子类,允许协议具有「完美完备性」?
2008年,Scott Aaronson通过实用分析方法,证明存在「量子预言机」,使得QMA≠QMA₁。
这意味着任何证明QMA=QMA₁的尝试,都需要「量子非相对化技术」。
这并非不可逾越障碍,但凸显了问题复杂性。
突破:双指数放大的理论极限
直至今年6月,Freek Witteveen和Stacey Jeffery发表重磅论文,证明QMA协议可通过黑盒方式放大,使完备性误差达到「双指数级小」,即1/exp(exp(n))。
论文地址:https://arxiv.org/pdf/2506.15551
他们采用了一种创新方法:将接受概率编码到量子态振幅中,这些振幅以几何级数递减。
事实证明,QMA这个相识25年的「老朋友」,依然能带来惊喜。
在8月线上会议中,Scott提问:
双指数完备性是黑盒技术的极限吗?能否进一步放大到三指数级小,即1/exp(exp(exp(n)))。
一周后,Scott与Freek合作完成完整证明,表明在黑盒技术下,双指数级小完备性误差已是极限。
换言之,他们将2008年「QMA≠QMA₁」预言机分离结果量化,所得「下界」恰好匹配6月论文的协议。
这项研究最引人注目之处,或许并非量子复杂性本身,而是AI在其中扮演的关键角色。
如前所述,这是Scott Aaronson首篇论文,其主要成果证明中的一个关键技术步骤来自AI辅助。
具体而言,是GPT5-Thinking模型。
当时,作者面临分析一个N×N厄米矩阵E(θ)(如N=2ⁿ),其每个元素均为实参数θ的poly(n)次三角多项式。
需要证明当θ从0变化到1时E(θ)的最大特征值,以证明λₘₐₓ(E(θ))不可能从接近0值开始,然后长时间「停留」在接近1状态,例如接近1/exp(exp(exp(n)))。
针对此问题,若有1-2周时间,Scott和合著者通过查阅文献也可解决。
但他选择了GPT5-Thinking,5分钟后,AI给出一个自信但明显错误的答案。
Scott并未嘲笑AI,而是指出错误所在。GPT5-Thinking思考片刻后,再次尝试提出更好方案。
经过几次迭代,如同与研究生或同事交流,GPT-5最终给出以下函数:
它正确指出,这是一个关于θ次数可控的有理函数,并精准编码了最大特征值λₘₐₓ(E(θ))与1接近程度的相关信息。
令人欣喜的是,该方法有效,无需AI协助即可轻松验证。
Scott认为,或许GPT-5在训练数据中见过类似结构,但若学生提出此方案,他会毫不犹豫称其为「巧妙」。
最后,他回忆道,一年前,使用当时GPT推理模型尝试类似问题,结果远不理想。
如今,是2025年9月,我可以明确告知——
AI已开始真正触及那些最具人类智慧特征的核心工作:证明量子复杂性类之间的预言机分离。
虽然它尚无法独立撰写整篇研究论文,但若研究者清楚目标,AI能帮助摆脱困境,这无疑是绝佳应用场景。
谁知道,这种情况将持续多久?
Scott Aaronson调侃道,「想到此,不禁庆幸自己还有铁饭碗——终身教职」。
参考资料:
https://scottaaronson.blog/?p=9183
https://x.com/SebastienBubeck/status/1972368891239375078
https://x.com/kimmonismus/status/1972399015825203463
本文由主机测评网于2026-01-05发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260114953.html