当前位置:首页 > 科技资讯 > 正文

AI进步未停,新范式引领智能飞跃

AI进步未停,新范式引领智能飞跃 AI进步 推理模型 多模态能力 模型蒸馏 第1张

人工智能是否触顶?近期,“AI进展减速”的论调甚嚣尘上。然而,Transformer论文的共同作者、OpenAI首席研究科学家Lukasz Kaiser在《Mad》播客中给出了截然相反的观点。

他坚信,AI的发展非但没有放缓,反而沿着稳定的指数级曲线加速前进。外界感受到的“停滞”,其实源于突破形态的改变。行业正在从一味追求“大模型”转向构建更聪明、更能思考的模型。

预训练依然是关键,但已不再是唯一引擎。推理模型的出现像是给基础模型加了一层“第二大脑”,让它们学会推导、验证与自我纠错,而不仅是预测下一个词。这意味着在相同成本下,模型能力跃升更明显、答案可靠性更高。

但AI的“智能地形图”仍极不均匀。Lukasz坦言,最强模型能攻克奥数难题,却可能在儿童拼图里数不清物体;能写出超越专业程序员的代码,却仍会误判一张照片的空间关系。

同时,新范式也带来了新的商业现实。面对上亿级用户,成本效率已压过算力堆叠,模型蒸馏从“可选项”变为“必需品”。能否让小模型复现大模型的智慧,决定了AI能否真正普及。

/ 01 / AI没减速,是你没看懂

主持人:今年以来,一直有观点认为AI发展正在放缓,预训练已触及天花板。但就在我们录制本期节目时,GPT-5.1、Codex Max等模型几乎同时亮相,这似乎打破了“AI停滞”的论调。

Lukasz:AI技术的进步一直是非常平稳的指数级能力提升。新技术层出不穷,进步来自于新发现、算力提升和更好的工程实现。

语言模型方面,Transformer的出现与推理模型是两大转折点。预训练处于S曲线上段,扩展定律并未失效。新的推理范式处于S曲线下部,同样成本能获得更多收益。

从ChatGPT 3.5到当下,核心变化在于模型不再仅依赖记忆权重输出答案,而是能查网页、推理分析后给出正确答案

/ 02 / AI学会“自我怀疑”,GPT开始提前纠正自己的错误

主持人:推理模型确实太新了。很多人其实还没完全搞明白它和基础模型的区别。你能用最通俗的话讲讲吗?

Lukasz:推理模型在给出最终答案前,会自己先在心里琢磨一番,形成一个“思考链条”,并且还能借助外部工具来帮自己理清思路。

它更厉害的地方在于,模型学习的重点就是“如何思考”本身,目标是找到更优的推理路径。

/ 03 / 预训练仍是耗电巨兽,RL和视频模型正疯狂抢GPU资源

主持人:谈谈从Google到OpenAI的转变吧。

Lukasz:Ilya Sutskever在OpenAI正在做语言模型,可能和我的方向很契合。OpenAI虽然还在早期阶段,但氛围很适合。

在OpenAI内部,大多数实验室都在做类似的工作。GPU的分配主要基于技术需求。目前预训练消耗的GPU最多。

/ 04 / 为什么GPT-5能解奥赛题,却败给5岁孩子的数学题?

主持人:从GPT-4到5到5.1,实际改变了什么?

Lukasz:GPT-5加入了推理能力和合成数据,同时预训练让成本大幅下降。GPT-5.1主要是后训练的改进。

/ 05 / GPT-5.2或将攻克AI最大缺陷:学会说“我不知道”

主持人:未来6到12个月,什么最让你兴奋?

Lukasz:最让我兴奋的是多模态推理正在成熟。当AI能同时理解图像和语言时,就会真正赋能机器人和科研这些领域。