OpenAI 的十岁生日,过得有些尴尬。
当天发布的 GPT-5.2 在技术层面堪称完美:横扫各大基准测试刷新 SOTA,数学与编程竞赛表现惊人,官方毫不吝啬地冠以 AI「超级大脑」之名。
可社交网络上的画风却截然相反——迎接它的不是赞誉,而是用户们的集体吐槽。
在 X 与 Reddit 上,失望的情绪几乎淹没了评论区。许多人又开始怀念当初的「白月光」GPT-4o:有人抱怨 GPT-5.2 变得平淡、刻板、像被削去了个性;还有人讽刺它活像个「把成年人当幼儿园小孩」的说教机器。
当舆论的矛头齐刷刷指向 OpenAI 及其 CEO Sam Altman,一个尖锐的问题浮出水面:为什么模型智商越来越高,用户却越来越不买账?
The Information 今晨的一篇报道,揭开了内幕。
过去一年,OpenAI 内部曾笃信一条定律:每一代模型越强,用户量必然暴增,因为「变聪明」本身就是最直观的体验升级。可如今,这条铁律失灵了。
诚然,模型在科研和复杂推理上的进步依然显著。研究团队耗费数月打磨逻辑能力,让它能应对更艰深的数学定理和科学难题,但绝大多数普通用户根本感知不到这些。
https://www.theinformation.com/articles/openais-organizational-problems-hurt-chatgpt?rc=qmzset
换句话说,智能的跃升,并不天然等于体验的飞跃。
普通用户要的不是一台「竞赛级大脑」,他们只想要一个「日常顺手的小助手」。OpenAI 对 150 万次对话的大数据分析印证了这一点:用户的核心需求极其朴实——实用指导(29%)、信息检索(24%)和写作辅助(24%),而编程类对话仅占 4.2%。
于是矛盾变得异常具体:技术团队在实验室里疯狂卷数理化、卷跑分,而用户只希望在对话框里一句话搞定问题——别绕圈子、别教育人、别拖泥带水。
战线拉得太长是另一大槽点。
今年以来,奥特曼同时启动了视频生成应用 Sora、音乐 AI、浏览器、AI Agent、硬件、机器人等多个新项目。摊子越铺越开,资源也越分越散。
这其实是科技巨头最经典的弯路:大本营还没夯实,就急着开辟第二、第三战场。短期看似「全面开花」,长期看却是贪多嚼不烂,犯了兵家大忌——每条线都缺人、缺算力、缺精雕细琢的耐心。
OpenAI 内部「研究优先」与「产品增长」之间的角力,在图像生成功能上暴露无遗:
尽管 GPT-4o 的吉卜力风格今年三月一度带动了 ChatGPT 的用户激增,但 OpenAI 还是把图像模型的开发优先级一推再推,直到 Nano Banana 口碑发酵,才匆忙回头补课,内部因此爆发严重分歧——
奥特曼认定图像模型是用户增长的抓手,研究主管 Mark Chen 却更想把资源押注在其他项目上。
此外,随着 Scaling Laws 边际收益递减,为了突破大模型瓶颈,OpenAI 过去一年将重心押在推理模型上,超过 1000 人的研究团队资源倾斜于此,导致 ChatGPT 日常体验的优化被边缘化。
这种资源错配不仅分散了精力,甚至在今年初的内测中出现了性能倒退——为了强行适配「聊天」场景,反而削弱了推理模型的纯粹性。后来虽然推出了「思考模式」和「深度研究」来分流、补救,但用户使用率极低,真正的日常对话体验并未因此变得更贴心。
新旧模型之间的兼容问题也层出不穷。
例如,GPT-5 集成进 ChatGPT 前,研究人员发现它在部分编程任务上表现反而变差——因为系统根据用户职业等个性化信息调整回答,结果干扰了模型判断,输出错误答案。
显然,推理模型越来越强,但 ChatGPT 的体验却在走下坡路。
当技术升级的方向与用户需求的方向开始分叉,谁会先妥协?答案显而易见。
Gemini 3 Pro 的强势登场,最终把 OpenAI 逼到了墙角,于是就有了奥特曼发布「红色警报」的名场面,要求 OpenAI 员工重新聚焦 ChatGPT,全力提升产品体验的吸引力。
几乎同一时间,OpenAI 应用负责人 Fidji Simo 也在个人博客中勾勒 ChatGPT 的未来愿景:从以文本为主的对话系统,转向可根据用户意图动态生成界面的全生成式 UI。
只不过Simo 也承认,公司本质依然是以研究为中心,「产品本身并不是终极目标」。
Fidji Simo
从商业角度看,这句话其实相当危险。
与主攻 API 市场的 Anthropic 不同,OpenAI 的营收大头来自个人订阅。在消费市场,没人会为企业的「终极理想」买单,用户只愿意为当下的体验付费。这好比餐厅大厨醉心于研发米其林星级料理,而大堂里的食客只想吃一碗热气腾腾的阳春面。
不过,若因此断言 OpenAI 内部已乱作一团,恐怕低估了这家公司的韧性。
据彭博社援引 Mark Chen 的说法,「红色警报」并非什么新鲜事,更像是一种战时状态的常态化管理工具。每当 OpenAI 需要集中火力猛攻某个单一目标,或要求团队放下低优先级任务时,这种机制就会启动。
播客地址:https://x.com/Kantrowitz/status/2001790090641645940
奥特曼在最近的播客访谈中,也否认了拉响红色警报带来的过度焦虑。
「首先,所谓的『红色警报』,在我们看来其实是一种低风险、但非常必要的应对手段。」奥特曼坦言,「当潜在的竞争威胁出现时,保持一点『偏执』、并快速做出反应,是件好事。」
他甚至提到今年年初 DeepSeek 的异军突起,认为那和现在的 Gemini 3 一样,都是一种良性的外部刺激。
「Gemini 3 到目前为止,还没带来我们原本担心的那种毁灭性冲击。虽然它和 DeepSeek 一样,精准地戳中了我们在产品策略上的软肋,但也倒逼我们做出了极其迅速的调整。」
在奥特曼看来,这种紧急状态通常只会持续六到八周。「我很高兴我们有这种快速反应机制,我们不会在这个状态里待太久。」
OpenAI 显然也明白光喊口号不够,他们今天也正式发布了 GPT-5.2-Codex。
作为专为解决复杂现实软件工程问题而生的智能体编程模型,GPT-5.2-Codex 在通用智能的基础上融合了 GPT-5.1-Codex-Max 的终端操作能力,更擅长处理代码重构、迁移等长程任务。
而在播客的尾声,当主持人问起「GPT-6 还要等多久?」时,奥特曼敞亮地回答:「我不知道我们什么时候会正式把某个模型命名为 GPT-6,但我预计在明年第一季度,会有比 5.2 显著提升的新模型发布。」
从拉响「红色警报」,到 GPT-5.2 系列的反击,再到 GPT-6 的暧昧预告,OpenAI 试图用新模型与新节奏重建信心,但决定长期胜负的,仍是分发入口、生态协同与算力成本这些硬门槛。
Google 的优势,绝不只在 Gemini 3 Pro 这一个模型,更在于它几乎无可匹敌的分发网络。
搜索、Chrome、办公套件。在 AI 赛道,护城河可能是所有科技产品中最浅的。用户的迁移成本几乎为零,当 Google 的 AI 产品如空气般无孔不入,这几乎成了一场无解的阳谋——你不需要被说服,你只会顺手就用。
更重要的是,在与 Google 的较量中,硬件层面的短板成了 OpenAI 最大的软肋。
相比 Google 十二年前就开始布局专用 AI 芯片(TPU)所建立的效率优势,OpenAI 每年仍需花费数十亿美元租用算力。即便试图通过自建数据中心和芯片来补课,但体验被追平、成本被碾压的现状已成定局。
用网友的话说:
OpenAI 现在并不需要一个更强大的模型,它需要的是 AMD。如果 OpenAI 收购了 AMD,这场 AI 之战就将宣告结束。Google 之所以不怕 OpenAI,是因为它拥有自家的 TPU。但它真正该担心的,是 OpenAI 拥有 AMD。
OpenAI 总裁 Greg Brockman 在最近的视频中也坦言,由于算力捉襟见肘,每当新功能上线(如年初 GPT-4o 吉卜力风格),就必须从研究部门抽血,把算力挪给产品部。这是一种饮鸩止渴的循环——为了维持今天的用户体验,被迫推迟明日的技术研发。
可算力这东西,归根结底就是两个字:烧钱。而且是海量地烧钱。
为此,据 WSJ 报道,OpenAI 已计划发起 1000 亿美元的巨额融资;若一切顺利,这家超级独角兽将在明年 Q1 之前,以 8300 亿美元的估值,再次刷新资本市场的想象力。
今年早些时候,软银同意向 OpenAI 投资 300 亿美元,并于上月出售所持的英伟达股份价值 58 亿美元,为这笔投资筹资,并预计尽快完成剩余 225 亿美元的出资。
但钱的问题远没那么简单。预计到 2030 年,OpenAI 的现金消耗将超过 2000 亿美元。相比之下,Google 财务稳健,甚至能通过 Oracle 等合作伙伴的股价波动间接挤压 OpenAI 的融资前景。
四处筹钱的 OpenAI,看起来更像是在和时间赛跑。于是便有了那个笑话:照奥特曼的融资能力,没准哪天连 Google 和英伟达都能打包带走。
玩笑归玩笑,钱能买来时间,却买不来口碑。
所以在 2025 年这个冬天,狂奔三年的 OpenAI 选择先踩一脚刹车,其实是对的:收拢战线、回撤资源,把重心重新对准 ChatGPT 的日常体验。
这是一次昂贵但必要的纠偏。
技术领先不等于产品好用,基准测试第一不等于用户满意。更重要的是,你不能只在用户怀念旧版本的时候,才想起来问问他们的感受。
本文由主机测评网于2026-02-12发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260224812.html