当前位置:首页 > 科技资讯 > 正文

AI时代大揭秘:从预训练到推理模型,跨越范式转换

我们正经历一场静悄悄但根本性的AI范式转变。

这一转变的意义,堪比Transformer本身。

过去一年,关于AI发展,出现了两种截然不同的观点:

  • 一边是“AI增长放缓、模型到顶、预训练无用论”
  • 另一边则是“AI大周”不断上演:GPT-5.1Gemini 3Grok 4.1

AI时代大揭秘:从预训练到推理模型,跨越范式转换 AI发展 Transformer GPT-5.1 多模态推理 第1张

作为Transformer作者之一,现任OpenAI研究科学家的Łukasz Kaiser最近接受采访,给出了他的看法。

信息量巨大,包括AI的底层范式转变、GPT-5.1的命名规则、未来AI的发展趋势……以及Transformer诞生背后的故事。

AI并未变慢了,而是换代了。

GPT-5.1不是简单的小版本迭代,OpenAI内部版本命名规则有所变化。

多模态推理将成为下一个突破点。

AI不会让人类完全失去工作。

家用机器人是继ChatGPT后最可见的AI革命。

下面一起看看详细内容:

AI发展并未放缓,而是平稳增长

过去一年,关于“模型进展变缓”的声音层出不穷,但Łukasz认为这种观点是错误的。

AI时代大揭秘:从预训练到推理模型,跨越范式转换 AI发展 Transformer GPT-5.1 多模态推理 第2张

他解释称:

从内部视角看,AI的能力增长是一条非常平滑的指数曲线。

这类似于摩尔定律,几十年来摩尔定律始终有效,甚至在GPU的推动下还在加速。归根结底,这是因为它历经了数代技术的迭代。

因此,从外部看,AI趋势平稳;而从内部看,其进步离不开新技术、计算机能力的提升和工程优化的共同作用。

至于为何有人觉得“变慢了”,原因在于:AI的底层范式已悄悄从预训练转向推理模型。这也是继Transformer诞生后的又一次关键转折。

如果把技术发展描述为一条S型曲线(起步→快速增长→平稳期),那么预训练处于S曲线的上升后期,而推理模型仍处于初期。

这并不意味着预训练的Scaling Laws失效了,它仍在发挥作用,只是与新的推理范式相比,需要投入更多资金。

AI时代大揭秘:从预训练到推理模型,跨越范式转换 AI发展 Transformer GPT-5.1 多模态推理 第3张

因此,出于经济考量,业内人士开始将工作重心转向更小、更便宜但质量相同的模型。这也是导致外界认为预训练已停止的原因之一。

回到推理模型上,由于该范式还处于新兴阶段,进步速度会非常快。

ChatGPT为例,GPT-3.5会直接基于训练数据记忆给出答案,而不会借助任何外部工具和推理。反观最新的ChatGPT会主动浏览网站、进行推理分析,再给出准确答案。对于普通用户来说,如果不仔细对比,可能会觉得二者差异不大。但实际上,这背后是性能质的飞跃。

GPT-5.1绝非小版本更新

AI时代大揭秘:从预训练到推理模型,跨越范式转换 AI发展 Transformer GPT-5.1 多模态推理 第4张

GPT-5.1看起来只是小版本更迭,实际从内部来讲,是一个巨大的稳定性迭代。

从GPT-4到GPT-5,得益于强化学习和合成数据的应用,GPT-5的推理能力明显提升。而GPT-5.1的改进则更多集中在后训练阶段,比如增加安全性、减少幻觉,以及添加多种风格选择。

从谷歌Transformer到OpenAI

AI时代大揭秘:从预训练到推理模型,跨越范式转换 AI发展 Transformer GPT-5.1 多模态推理 第5张

下一次突破来自多模态推理+具身智能

AI会改变工作,但不会让工作消失。

AI时代大揭秘:从预训练到推理模型,跨越范式转换 AI发展 Transformer GPT-5.1 多模态推理 第6张