当前位置：首页 > 科技资讯 > 正文

AI进步未停，新范式引领智能飞跃

AI进步未停，新范式引领智能飞跃 AI进步推理模型多模态能力模型蒸馏第1张

人工智能是否触顶？近期，“AI进展减速”的论调甚嚣尘上。然而，Transformer论文的共同作者、OpenAI首席研究科学家Lukasz Kaiser在《Mad》播客中给出了截然相反的观点。

他坚信，AI的发展非但没有放缓，反而沿着稳定的指数级曲线加速前进。外界感受到的“停滞”，其实源于突破形态的改变。行业正在从一味追求“大模型”转向构建更聪明、更能思考的模型。

预训练依然是关键，但已不再是唯一引擎。推理模型的出现像是给基础模型加了一层“第二大脑”，让它们学会推导、验证与自我纠错，而不仅是预测下一个词。这意味着在相同成本下，模型能力跃升更明显、答案可靠性更高。

但AI的“智能地形图”仍极不均匀。Lukasz坦言，最强模型能攻克奥数难题，却可能在儿童拼图里数不清物体；能写出超越专业程序员的代码，却仍会误判一张照片的空间关系。

同时，新范式也带来了新的商业现实。面对上亿级用户，成本效率已压过算力堆叠，模型蒸馏从“可选项”变为“必需品”。能否让小模型复现大模型的智慧，决定了AI能否真正普及。

/ 01 / AI没减速，是你没看懂

主持人：今年以来，一直有观点认为AI发展正在放缓，预训练已触及天花板。但就在我们录制本期节目时，GPT-5.1、Codex Max等模型几乎同时亮相，这似乎打破了“AI停滞”的论调。

Lukasz：AI技术的进步一直是非常平稳的指数级能力提升。新技术层出不穷，进步来自于新发现、算力提升和更好的工程实现。

语言模型方面，Transformer的出现与推理模型是两大转折点。预训练处于S曲线上段，扩展定律并未失效。新的推理范式处于S曲线下部，同样成本能获得更多收益。

从ChatGPT 3.5到当下，核心变化在于模型不再仅依赖记忆权重输出答案，而是能查网页、推理分析后给出正确答案。

主持人：推理模型确实太新了。很多人其实还没完全搞明白它和基础模型的区别。你能用最通俗的话讲讲吗？

Lukasz：推理模型在给出最终答案前，会自己先在心里琢磨一番，形成一个“思考链条”，并且还能借助外部工具来帮自己理清思路。

它更厉害的地方在于，模型学习的重点就是“如何思考”本身，目标是找到更优的推理路径。

主持人：谈谈从Google到OpenAI的转变吧。

Lukasz：Ilya Sutskever在OpenAI正在做语言模型，可能和我的方向很契合。OpenAI虽然还在早期阶段，但氛围很适合。

在OpenAI内部，大多数实验室都在做类似的工作。GPU的分配主要基于技术需求。目前预训练消耗的GPU最多。

主持人：从GPT-4到5到5.1，实际改变了什么？

Lukasz：GPT-5加入了推理能力和合成数据，同时预训练让成本大幅下降。GPT-5.1主要是后训练的改进。

主持人：未来6到12个月，什么最让你兴奋？

Lukasz：最让我兴奋的是多模态推理正在成熟。当AI能同时理解图像和语言时，就会真正赋能机器人和科研这些领域。

本文由主机测评网于2026-05-18发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260545326.html