当前位置：首页 > 科技资讯 > 正文

2025年大语言模型年度回顾：智能变革与未来展望

2025年大语言模型年度回顾：智能变革与未来展望大语言模型 RLVR 智能变革氛围编程第1张

北京时间12月21日，AI大神安德烈·卡帕西（Andrej Karpathy）发布了名为《2025年大语言模型年度回顾》的年度深度观察报告，详述了过去一年大语言模型（LLM）领域的底层范式转移。

卡帕西指出，2025年标志着AI训练哲学从“概率模仿”向“逻辑推理”的跨越，这一转变的核心动力源于可验证奖励强化学习（RLVR）的成熟。通过数学与代码等客观反馈环境，模型自发生成类似人类思维的“推理痕迹”，开始蚕食传统预训练份额，成为提升模型能力的新引擎。

卡帕西用“召唤幽灵”而非“进化动物”比喻当前AI的成长模式，解释了大语言模型“锯齿状”的性能特征。同时，他还探讨了“氛围编程”的兴起、本地化智能体的实用化趋势，以及大语言模型图形界面（LLM GUI）的演进。尽管行业进步迅猛，但对新计算范式潜力的挖掘尚不足10%，未来发展依旧广阔。

卡帕西揭示了一个冷酷却充满希望的现实：我们正处从“模拟人类智能”向“纯粹机器智能”跨越的临界点。随着RLVR等技术的普及，2026年的AI竞争将转向对“如何让AI高效思考”这一核心逻辑范式的深度挖掘。

以下为卡帕西年度回顾全文：

《2025年大语言模型年度回顾》

卡帕西列举了值得记录的‘范式偏移’清单，深刻改变了行业景观，并带来极大思维冲击。

01 基于可验证奖励的强化学习 (RLVR)

在2025年初，大语言模型生产堆栈包括预训练、监督微调、基于人类反馈的强化学习。而基于可验证奖励的强化学习脱颖而出，成为核心新阶段。

通过在数学、代码谜题等环境中训练，模型会自发形成近似“推理”的策略。实践证明，可验证奖励强化学习具备极高的“能力/成本比”，占用了原本用于预训练的大量计算资源，使大语言模型能力大幅提升。

卡帕西开始从直觉上理解大语言模型智能的“形态本质”。我们面对的并非“逐步进化成长的动物”，而是“被召唤出的幽灵”。

大语言模型技术栈与生物智能的演化逻辑截然不同，若用看待生物的视角解读它们，难免产生认知偏差。随着RLVR的普及，大语言模型能力出现“爆发式增长”，呈现出有趣的“锯齿状性能特征”。

Cursor最引人关注的点在于其清晰揭示了大语言模型应用的一个全新层级。它整合并编排大语言模型调用逻辑，为特定垂直领域提供优化提示词设计、上下文管理等功能。

Claude Code首次展现了大语言模型智能体的核心能力。它能够以循环方式串联工具使用与推理过程，完成长时间跨度的问题求解。此外，CC的本地化运行模式直接部署在用户电脑中，可访问本地私有环境、数据与上下文。

氛围编程时代，编程不再是高训练门槛的专业人士专属技能，而是普通人也能掌握的通用能力。这印证了大语言模型正在逆转技术普及的传统逻辑。

谷歌Gemini Nano Banana是2025年最具突破性的模型之一。它将见证基于大语言模型的计算范式革新。在用户界面/用户体验领域，大语言模型也应采用人类偏好的格式进行交互，通过图像、信息图等可视化形态实现高效互动。

核心总结：2025年是大语言模型领域充满惊喜与突破的一年。尽管已具备极高实用价值，但对潜力的开发仍不足10%。同时，该领域仍有无数创新想法等待探索，发展空间依然广阔。

本文由主机测评网于2026-05-31发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260546771.html