DeepConf由Meta AI与加州大学圣地亚哥分校携手打造,核心理念在于让大模型在推理过程中实时监控制信度,淘汰低置信度路径,而高置信度路径则通过加权投票来平衡准确性与效率。在AIME 2025竞赛中,它首次实现了开源模型无需外部工具便达到99.9%准确率,同时削减了85%的生成token。
如何让模型在思考时更加聪明且高效,同时确保答案的可靠性?
近期,Meta AI与加州大学圣地亚哥分校的研究团队给出了振奋人心的答案——Deep Think with Confidence(DeepConf),让模型自信地深度思考。
这项新方法通过并行思考与「置信度筛选」,不仅让模型在国际顶尖数学竞赛AIME 2025上取得了高达99.9%的正确率。
可以说,这是首次利用开源模型在AIME 2025上实现99.9%的准确率,并且无需任何工具辅助!
在保持高质量推理的同时,DeepConf还将生成的token数量削减了84.7%。
DeepConf为并行思考(parallel thinking)带来了多项硬核优势:
以DeepConf在HMMT 25(哈佛–麻省理工数学竞赛)的第11道题目上的推理过程为例。
核心思想是DeepConf通过「置信度信号」筛选推理路径,从而得到高质量答案,并在效率与准确率之间取得平衡。
DeepConf在生成过程中,会持续监控推理路径的置信度,低置信度路径被及时淘汰,只保留「更有把握」的路径,提升整体准确性。
通过准确率对比曲线,上图可以看出纵轴是accuracy(准确率),黄色曲线(DeepConf)比蓝色曲线(标准方法)明显更高。
表明DeepConf在相同投票规模下能达到更高的准确率。
下图横轴是token数量(推理所需的计算成本),黄色曲线在准确率保持较高的同时,token消耗明显更少。
表明DeepConf大幅减少了无效token的生成,推理效率更优。
DeepConf让模型不再「胡思乱想」,而是高效地走在高置信度的推理轨道上。
本文由主机测评网于2026-04-24发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260440070.html