当前位置：首页 > 科技资讯 > 正文

DeepConf：自信思考，让AI模型更高效准确

DeepConf由Meta AI与加州大学圣地亚哥分校携手打造，核心理念在于让大模型在推理过程中实时监控制信度，淘汰低置信度路径，而高置信度路径则通过加权投票来平衡准确性与效率。在AIME 2025竞赛中，它首次实现了开源模型无需外部工具便达到99.9%准确率，同时削减了85%的生成token。

如何让模型在思考时更加聪明且高效，同时确保答案的可靠性？

近期，Meta AI与加州大学圣地亚哥分校的研究团队给出了振奋人心的答案——Deep Think with Confidence（DeepConf），让模型自信地深度思考。

DeepConf：自信思考，让AI模型更高效准确 DeepConf 置信度筛选并行思考 AIME 2025 第1张

论文地址：https://arxiv.org/pdf/2508.15260

项目主页：https://jiaweizzhao.github.io/deepconf

这项新方法通过并行思考与「置信度筛选」，不仅让模型在国际顶尖数学竞赛AIME 2025上取得了高达99.9%的正确率。

可以说，这是首次利用开源模型在AIME 2025上实现99.9%的准确率，并且无需任何工具辅助！

DeepConf：自信思考，让AI模型更高效准确 DeepConf 置信度筛选并行思考 AIME 2025 第2张

在保持高质量推理的同时，DeepConf还将生成的token数量削减了84.7%。

DeepConf：自信思考，让AI模型更高效准确 DeepConf 置信度筛选并行思考 AIME 2025 第3张

DeepConf为并行思考（parallel thinking）带来了多项硬核优势：

以DeepConf在HMMT 25（哈佛–麻省理工数学竞赛）的第11道题目上的推理过程为例。

DeepConf：自信思考，让AI模型更高效准确 DeepConf 置信度筛选并行思考 AIME 2025 第4张

核心思想是DeepConf通过「置信度信号」筛选推理路径，从而得到高质量答案，并在效率与准确率之间取得平衡。

DeepConf在生成过程中，会持续监控推理路径的置信度，低置信度路径被及时淘汰，只保留「更有把握」的路径，提升整体准确性。

DeepConf：自信思考，让AI模型更高效准确 DeepConf 置信度筛选并行思考 AIME 2025 第5张

通过准确率对比曲线，上图可以看出纵轴是accuracy（准确率），黄色曲线（DeepConf）比蓝色曲线（标准方法）明显更高。

表明DeepConf在相同投票规模下能达到更高的准确率。

下图横轴是token数量（推理所需的计算成本），黄色曲线在准确率保持较高的同时，token消耗明显更少。

表明DeepConf大幅减少了无效token的生成，推理效率更优。

DeepConf让模型不再「胡思乱想」，而是高效地走在高置信度的推理轨道上。

DeepConf：自信思考，让AI模型更高效准确 DeepConf 置信度筛选并行思考 AIME 2025 第6张

本文由主机测评网于2026-04-24发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260440070.html