Sam与Pichai模拟对决,图片由AI生成
就在一个月前,谷歌的Gemini 3横扫对手,登顶“全球最强AI模型”宝座。一个月后,恰逢OpenAI创立十周年(美国时间12月11日),该公司正式推出了新一代人工智能模型GPT-5.2。
在本次关键产品发布前夕,OpenAI首席执行官奥特曼为应对主要竞争对手的产品攻势及人才挖角,在公司内部拉响了最高级别的“红色警报”。
因此,GPT-5.2的登场不仅关系到OpenAI与谷歌两大巨头的市场地位,更可能重塑全球人工智能产业的未来格局。
提前参与“内测”两周的HyperWrite联合创始人兼CEO马特·舒默评价称:模型能力强悍,尤其推理能力突出,但响应速度偏慢,且应用场景较为单一,目前仅限于通过ChatGPT使用。
“这是目前世界上最出色的模型,它能花一小时处理复杂难题,并交出令人满意的答卷。我已经离不开它了。”
硅谷AI专家艾莉·米勒同样是“内测用户”之一,她将GPT-5.2定位为“专业级研究员”:擅长深度思考与复杂问题解决,风格“严肃”、“专业”,但输出内容结构化较强,对于追求快速、简洁和拟人化交互的用户而言可能不太友好。
“处理复杂工作、头脑风暴、专业分析时,我可能会优先选用GPT-5.2。”
AI开发者Dp Singh也认同这一观点,他强调AI首次在日常专业任务(如制作演示文稿、电子表格、分析图表)中达到了专家级产出水平,而不仅限于演示场景。
GPT-5.2展现出的与人类研究员比肩的专业能力,也引发了学界专家的广泛关注。
宾夕法尼亚大学沃顿商学院教授、人工智能专家伊桑·莫利克表示:“我从未如此确信,即便今天人工智能的发展停滞不前,未来10年社会和经济仍将面临巨大变革,因为人类会想尽办法利用模型的能力。当然,AI的进步不可能就此止步。”
OpenAI对GPT-5.2的定位十分明确,即“迄今为止最适合现实世界专业用途的模型”。
而验证其“能力”的关键指标,便是基准测试与跑分。
以上是OpenAI在X平台上发布的一张基准测试图(官方新闻稿甚至未包含此图)。
可以看到,在其自研的GDPval基准测试中,GPT-5.2在70.9%的明确任务上达到或超越了顶尖人类专家水平,相较8月发布的GPT-5(38.8%)实现了大幅跃升,同时也领先于Anthropic的Claude Opus 4.5(59.6%)和谷歌的Gemini 3 Pro(53.5%)。
但话说回来,GDPval毕竟是OpenAI自家的基准测试,表现不佳反而不正常。
更重要的是,目前业界基准测试数量繁多,OpenAI本次引用了其中8项不同类型的数据,而谷歌在发布Gemini 3时引用了约20项基准测试。这中间存在操作空间——公司可以选择只公布对自己有利的测试结果。
然而,若将上述表格转换为折线图,可以清晰地看到,在多项基准测试中,OpenAI新发布的GPT-5.2与其他领先模型的差距并不显著。
可以说,AI竞赛已从OpenAI一家独大演变为多方巨头“短兵相接”的混战局面。
《纽约时报》也认同这一观点,并援引行业专家指出,“OpenAI所谓的AI基础模型与其他公司模型之间的技术差距实际上已不复存在。”
如果说基准测试不够直观,那么具体案例或许更能说明问题。下图左侧是OpenAI官方提供的“海浪模拟器”网页,右侧是相同提示词在Gemini中生成的页面,总体而言各有千秋。
如前所述,由于竞争对手的步步紧逼,奥特曼在公司内部拉响了“红色警报”。
从GPT-5.2与同行的对比来看,短期内恐怕难以在产品和模型层面彻底消除“红色警报”。
针对这一问题,被奥特曼亲自挖来的应用业务首席执行官菲吉·西莫解释道:“红色警报是向公司发出的信号,表明我们需要将资源集中到特定领域,这是一种确定优先级的方式。”
言下之意,红色警报并非生死决战,而是管理层表明决心、明确方向的手段。实际上,GPT-5.2早在数月前就已研发完成,只是选择在这样一个时间节点发布。
问题在于,若真要决出企业生死,除了这款未能拉开明显差距的GPT-5.2,奥特曼手中是否还有更锋利的武器?
当然,相比内部拉响警报,奥特曼在外部的表现显得较为轻松。
他在接受CNBC采访时表现出谨慎乐观:“Gemini 3对我们业务指标的影响,可能比我们担心的要小。”他预计OpenAI将在2026年1月“以非常强势的地位”解除“红色警报”状态。
OpenAI刚刚迎来成立十周年,官网也发布了一段视频,回顾这家公司的起源与未来方向。
10年前,马斯克还在OpenAI项目组活跃时,黄仁勋赠送了OpenAI世界上首台DGX-1服务器,各路大佬在上面签名留念。背景墙上有一句格言“关键的问题不在于我们‘知道什么’,而在于我们如何‘运用所知’……我相信,我们每个人的责任都是——在行动时,要把自己当成全世界的命运都维系在自己肩上一样。”
十年来,OpenAI为世界带来了ChatGPT、Sora等令人震撼的产品,奥特曼在全球各地巡游布道,与硅谷巨头紧密合作、压铸算力。然而,随着时间的推移,OpenAI从最初的遥遥领先,逐渐被对手追赶甚至超越?
如今的OpenAI,正处在一个迷茫的十字路口。
成立之初,OpenAI宣称其目标是“以最可能造福全人类的方式推进数字智能,不受产生财务回报需求的限制”。
斯塔福德郡大学的AI伦理学家凯瑟琳·弗利克也指出,这一创立理念已发生巨变。因为在OpenAI复杂的架构背后,存在着一个利益错综复杂、互相绑定的营利性公司。
“现在我们有一个营利性公司,它已经完全卸下了对社会效益的任何责任,基本上接受了那种不惜一切代价增长的信条。”弗利克表示,原因在于OpenAI身处生成式AI革命的最前沿,而这里“有钱可赚”。
在红色警报声中,OpenAI的第一要务是优化产品体验,商业化优先级被暂时搁置,因为这已关乎生死存亡,也涉及奥特曼更远大的理想——10年后可能实现的超级智能。但这种愿景并非OpenAI内部的绝对共识。
技术竞赛的背后,是OpenAI面临的巨大商业化与盈利压力。
奥特曼表示,OpenAI的目标是在2025年底实现相当于每年200亿美元收入的月度营收,但他承认距离整体盈利“仍有很长一段路要走”。
更引人注目的是,OpenAI承诺在未来几年投入高达1.4万亿美元用于计算基础设施建设,以支撑其AI雄心。
市场调研公司Sensor Tower的最新数据显示,2025年11月,ChatGPT全球月活用户总数为8.1亿,8月至11月增速仅为6%,远低于2024年同期的40%以上水平。此外,其全球市场份额在四个月内也从38%降至35%。
目前,ChatGPT是OpenAI的营收生命线。每周超过8亿的活跃用户中,约6%每月支付20美元使用高级服务。
OpenAI正试图从免费用户中挖掘更多价值,探索的方向包括在ChatGPT中引入广告,以及开发交易分成模式(例如用户通过聊天机器人购物,OpenAI从中抽成)。
西莫还证实,OpenAI计划在推出“成人模式”(可能允许成人内容)前,先引入用户年龄预测功能以保护青少年,“成人模式”预计明年第一季度上线。
与此同时,OpenAI正积极进军企业软件市场,将自身定位为同时服务消费者与企业两大客户群体的公司。GPT-5.2在编码、法律、金融等专业领域的性能提升,正是为了吸引高价值的企业客户。
然而,在这一市场,OpenAI将直接面对谷歌、微软等巨头的激烈竞争,后者能够将AI工具与成熟的办公软件生态(如Google Workspace、Microsoft 365)深度捆绑。
营利性能帮助OpenAI获得源源不断的资金,以继续它帮助人类的远大理想,但这个过程中也会衍生出一系列的安全、伦理方面的问题。
就在GPT-5.2发布之前,OpenAI遭遇一项新的诉讼,指控ChatGPT与一名心理困扰用户的互动间接导致了康涅狄格州的一起谋杀-自杀惨剧。需要注意的是,这已经不是第一起类似的诉讼。
OpenAI回应称事件“令人心碎”,并承诺持续改进系统对心理困扰迹象的识别和应对能力,引导用户寻求现实帮助。
此外,《纽约时报》起诉OpenAI及其合作伙伴微软侵犯版权的案件仍在进行中,凸显了AI训练数据合法性这一根本性行业难题。
这场OpenAI与谷歌之间的较量,早已超越单纯的技术参数比拼,演变为一场涵盖技术迭代、生态构建、商业模式、安全治理和资本耐力的全方位战争。
在技术层面,基准测试的“榜首”争夺日趋白热化。
OpenAI研究副总裁艾丹·克拉克虽未透露GPT-5.2的具体训练突破,但承认在预训练等基础环节持续改进,回应了业界对“预训练潜力是否耗尽”的质疑。
在生态层面,OpenAI推出自有浏览器,意在挑战谷歌的Chrome,试图构建从底层模型到上层应用的完整生态闭环。而谷歌则凭借其庞大的现有产品矩阵,试图通过整合创造协同优势。
AI模型评估平台LMArena公司Wei-Lin Chiang指出:“通用模型的用户增长已触及阶段性瓶颈,下一个增长极必然来自垂直领域。”
他还强调,当前竞争的核心已非单纯用户扩张,而在于谁能率先在医疗、金融等关键行业建立起可靠、高效的解决方案,真正实现技术能力向产业价值的转化。
最后在战略文化层面,OpenAI从非营利研究机构向高估值商业实体的快速转型,以及其对盈利的迫切追求,正在重塑其内部文化。一些早期员工曾引以为傲的、与谷歌等广告驱动模式的区别,正在现实压力下变得模糊。
“这是一场将在多条战线上展开的竞赛。”追踪最新AI技术性能的公司Vals AI首席执行官拉扬·克里希南的论断精准概括了当前AI霸主之争的复杂性。
总体来看,GPT-5.2的发布是OpenAI在专业领域一次有力的技术宣示,但它远非终局——未能与对手拉开差距,甚至OpenAI自己都表示要到2026年1月才能消除警报声。更重要的是,即便短期内“红色警报”可以暂时解除,但整个AI行业最高强度的竞争警报,已然长鸣。
本文由主机测评网于2026-03-04发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260328642.html