我们正经历一场静悄悄但根本性的AI范式转变。
这一转变的意义,堪比Transformer本身。
过去一年,关于AI发展,出现了两种截然不同的观点:
作为Transformer作者之一,现任OpenAI研究科学家的Łukasz Kaiser最近接受采访,给出了他的看法。
信息量巨大,包括AI的底层范式转变、GPT-5.1的命名规则、未来AI的发展趋势……以及Transformer诞生背后的故事。
AI并未变慢了,而是换代了。
GPT-5.1不是简单的小版本迭代,OpenAI内部版本命名规则有所变化。
多模态推理将成为下一个突破点。
AI不会让人类完全失去工作。
家用机器人是继ChatGPT后最可见的AI革命。
下面一起看看详细内容:
过去一年,关于“模型进展变缓”的声音层出不穷,但Łukasz认为这种观点是错误的。
他解释称:
从内部视角看,AI的能力增长是一条非常平滑的指数曲线。
这类似于摩尔定律,几十年来摩尔定律始终有效,甚至在GPU的推动下还在加速。归根结底,这是因为它历经了数代技术的迭代。
因此,从外部看,AI趋势平稳;而从内部看,其进步离不开新技术、计算机能力的提升和工程优化的共同作用。
至于为何有人觉得“变慢了”,原因在于:AI的底层范式已悄悄从预训练转向推理模型。这也是继Transformer诞生后的又一次关键转折。
如果把技术发展描述为一条S型曲线(起步→快速增长→平稳期),那么预训练处于S曲线的上升后期,而推理模型仍处于初期。
这并不意味着预训练的Scaling Laws失效了,它仍在发挥作用,只是与新的推理范式相比,需要投入更多资金。
因此,出于经济考量,业内人士开始将工作重心转向更小、更便宜但质量相同的模型。这也是导致外界认为预训练已停止的原因之一。
回到推理模型上,由于该范式还处于新兴阶段,进步速度会非常快。
ChatGPT为例,GPT-3.5会直接基于训练数据记忆给出答案,而不会借助任何外部工具和推理。反观最新的ChatGPT会主动浏览网站、进行推理分析,再给出准确答案。对于普通用户来说,如果不仔细对比,可能会觉得二者差异不大。但实际上,这背后是性能质的飞跃。
GPT-5.1看起来只是小版本更迭,实际从内部来讲,是一个巨大的稳定性迭代。
从GPT-4到GPT-5,得益于强化学习和合成数据的应用,GPT-5的推理能力明显提升。而GPT-5.1的改进则更多集中在后训练阶段,比如增加安全性、减少幻觉,以及添加多种风格选择。
AI会改变工作,但不会让工作消失。
本文由主机测评网于2026-05-18发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260545338.html