当前位置:首页 > 科技资讯 > 正文

2025年大语言模型年度回顾:智能变革与未来展望

2025年大语言模型年度回顾:智能变革与未来展望 大语言模型 RLVR 智能变革 氛围编程 第1张

北京时间12月21日,AI大神安德烈·卡帕西(Andrej Karpathy)发布了名为《2025年大语言模型年度回顾》的年度深度观察报告,详述了过去一年大语言模型(LLM)领域的底层范式转移。

卡帕西指出,2025年标志着AI训练哲学从“概率模仿”向“逻辑推理”的跨越,这一转变的核心动力源于可验证奖励强化学习(RLVR)的成熟。通过数学与代码等客观反馈环境,模型自发生成类似人类思维的“推理痕迹”,开始蚕食传统预训练份额,成为提升模型能力的新引擎。

卡帕西用“召唤幽灵”而非“进化动物”比喻当前AI的成长模式,解释了大语言模型“锯齿状”的性能特征。同时,他还探讨了“氛围编程”的兴起、本地化智能体的实用化趋势,以及大语言模型图形界面(LLM GUI)的演进。尽管行业进步迅猛,但对新计算范式潜力的挖掘尚不足10%,未来发展依旧广阔。

卡帕西揭示了一个冷酷却充满希望的现实:我们正处从“模拟人类智能”向“纯粹机器智能”跨越的临界点。随着RLVR等技术的普及,2026年的AI竞争将转向对“如何让AI高效思考”这一核心逻辑范式的深度挖掘。

以下为卡帕西年度回顾全文:

《2025年大语言模型年度回顾》

卡帕西列举了值得记录的‘范式偏移’清单,深刻改变了行业景观,并带来极大思维冲击。

01 基于可验证奖励的强化学习 (RLVR)

在2025年初,大语言模型生产堆栈包括预训练、监督微调、基于人类反馈的强化学习。而基于可验证奖励的强化学习脱颖而出,成为核心新阶段。

通过在数学、代码谜题等环境中训练,模型会自发形成近似“推理”的策略。实践证明,可验证奖励强化学习具备极高的“能力/成本比”,占用了原本用于预训练的大量计算资源,使大语言模型能力大幅提升。

02 “幽灵”与“动物”之辩/锯齿状智能

卡帕西开始从直觉上理解大语言模型智能的“形态本质”。我们面对的并非“逐步进化成长的动物”,而是“被召唤出的幽灵”。

大语言模型技术栈与生物智能的演化逻辑截然不同,若用看待生物的视角解读它们,难免产生认知偏差。随着RLVR的普及,大语言模型能力出现“爆发式增长”,呈现出有趣的“锯齿状性能特征”。

03 Cursor与大语言模型应用的新层级

Cursor最引人关注的点在于其清晰揭示了大语言模型应用的一个全新层级。它整合并编排大语言模型调用逻辑,为特定垂直领域提供优化提示词设计、上下文管理等功能。

04 Claude Code/驻留在电脑里的AI

Claude Code首次展现了大语言模型智能体的核心能力。它能够以循环方式串联工具使用与推理过程,完成长时间跨度的问题求解。此外,CC的本地化运行模式直接部署在用户电脑中,可访问本地私有环境、数据与上下文。

05 氛围编程

氛围编程时代,编程不再是高训练门槛的专业人士专属技能,而是普通人也能掌握的通用能力。这印证了大语言模型正在逆转技术普及的传统逻辑。

06 Nano Banana/大语言模型图形界面

谷歌Gemini Nano Banana是2025年最具突破性的模型之一。它将见证基于大语言模型的计算范式革新。在用户界面/用户体验领域,大语言模型也应采用人类偏好的格式进行交互,通过图像、信息图等可视化形态实现高效互动。

核心总结:2025年是大语言模型领域充满惊喜与突破的一年。尽管已具备极高实用价值,但对潜力的开发仍不足10%。同时,该领域仍有无数创新想法等待探索,发展空间依然广阔。