当前位置：首页 > 科技资讯 > 正文

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？

主机测评网
科技资讯
2026-03-04
434

号称要全面超越 Gemini 的 GPT-5.2 于今日凌晨正式向所有用户开放。上个月刚刚退订 ChatGPT Plus 并转向 Gemini 的用户，现在是否值得为了 GPT-5.2 重新订阅？通过整理网友的真实体验以及 APPSO 的深度实测，或许能帮你找到答案。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第1张

这次终于没再把表格画错了。GPT-5.2 此次共更新了三款模型：GPT-5.2 Instant、Thinking 以及 Pro 模型。如果你此前习惯了 Gemini 3.0 Pro 每次回答前的深度思考过程，那么初次使用 GPT-5.2 Thinking/Pro 时，你会明显感觉到思考速度变慢，等待时间比以往更长。这也是目前多数提前体验的用户在社交平台上分享的共同感受。即 GPT-5.2 相较 5.1 在各方面均有提升，尤其是 GPT-5.2 Pro 非常适合处理复杂的专业推理任务，但代价是结果输出的过程更加漫长。

例如有用户分享，输入提示词「帮我绘制一张 HLE 测试成绩的图表」，GPT-5.2 Pro 足足花了 24 分钟才生成这张表。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第2张

好在所有数据都准确无误，图表中最好的结果依然显示为 Gemini 3.0 Pro。这也得益于 GPT-5.2 的知识截止日期更新至 2025 年 8 月，而 GPT-5.1 还停留在 2024 年 9 月，上个月发布的 Gemini 3.0 也只截止到 2025 年 1 月。

当我们使用 GPT-5.2 Thinking 生成 OpenAI 模型发布历史的图表时，耗时并不长，信息也比较准确。如果是简单任务，用 Thinking 模型与 Pro 模型的耗时差异会非常明显。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第3张

提示词：generate a chart graph of OpenAI model release over time

凭借强大的推理能力、最新的世界知识，以及多模态理解与推理能力的结合，GPT-5.2 迅速在大模型竞技场上跃升至第二名。GPT-5.2-High 在网页开发项目中排名第二，GPT-5.2 排名第六。相比之下，Gemini 3.0 Pro 排名第三，榜首依然是 Claude。

LMArena 官方也发布了一段实测视频，他们用 GPT-5.2 完成了一系列 3D 建模任务，完成度相当高。不过仍有网友调侃说：「这是回到 2003 年了吗？」

视频来源：https://x.com/arena/status/1999189215603753445

这种利用 three.js 实现的 3D 效果，极其考验模型的多模态理解、推理能力，以及编程开发和设计的优化。GPT-5.2 的升级幅度确实对得起这 0.1 的版本号提升。目前网友分享的大量测试大多集中在构建完整的 3D 引擎，GPT-5.2 的表现都可圈可点。例如有用户用 GPT-5.2 Thinking 的高难度推理模式，在单页文件中构建了一个支持交互控制、可导出 4K 分辨率的 3D 雪天冰块王国模型。

https://x.com/skirano/status/1999182295685644366

还有用户用 GPT-5.2 Pro 实现了波涛汹涌的哥特式城市建筑 3D 场景。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第4张

提示词：create a visually interesting shader that can run in twigl-dot-app make it like an infinite city of neo-gothic towers partially drowned in a stormy ocean with large waves.｜来源：https://x.com/emollick/status/1999185085719887978?s=20

关于 3D 理解与推理能力，我们也使用了 Ian Goodfellow 在 Gemini 3.0 Pro 发布后测试过的提示词：上传一张图片，要求模型根据图片生成一个漂亮的体素艺术 Three.js 单页场景。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第5张

由于 ChatGPT 未在画布内直接生成，我们将对话框生成的代码复制到 HTML View 中打开，结果如右图所示。差异相当明显：ChatGPT 虽然识别了上传图片的内容（一棵粉红色的树、一片绿草地、灰色下沉区域和白色水流），但生成的 3D 动画相较于 Gemini 3.0 Pro 显得简陋不少。只能说，奥特曼发出的「红色警报」恰恰证明了 Gemini 的实力。

编程能力测试自然少不了经典的六边形小球物理运动。有博主加大了难度，使用全部闪着红光的 3D 小球。效果炫酷，许多网友询问实现方法；但也有网友指出，这些小球似乎不受重力控制。随后有人回复说，这是在模拟太空环境。

视频来源：https://x.com/flavioAd/status/1999183432203567339

还有 SVG 代码测试：骑自行车的鹈鹕。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第6张

有网友分享自己用 GPT-5.2 制作了一个森林火灾模拟器，可调节速度、片区大小和火焰燃烧范围。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第7张

我们制作了一个星球信号网页，布局与森林火情可视化网页如出一辙，左侧显示内容，星点换成了太空星球。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第8张

提示词：Create an interactive HTML, CSS, and JavaScript simulation of a satellite system that transmits signals to ground receivers. The simulation should show a satellite orbiting the Earth and periodically sending signals that are received by multiple

我们也用之前测试 Gemini 3 的拍立得项目来考验 GPT-5.2。输入同样的提示词，要求开发一个复古拍立得风格的网页相机应用。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第9张

提示词：开发一个具有复古拟物风格的单页相机应用。页面背景请设计为软木板或深色木纹材质，左下角固定一个纯 CSS 或 SVG 绘制的拟物化拍立得相机模型，其镜头区域实时显示用户摄像头画面；交互逻辑上，当用户点击快门按钮时，播放快门音效，并让一张带有白色边框的相纸从相机顶部缓慢吐出；请利用 CSS 滤镜让滑出的照片初始状态为高模糊且黑白，在 5 秒内平滑过渡到清晰全彩状态；最后，所有显影完成的照片必须支持自由拖拽，允许用户将其随意摆放在页面任意位置，且照片要有随机的微小旋转角度和阴影，点击某张照片时应将其置顶，从而形成一个逼真的自由照片拼贴墙。

令人意外的是，一次成型，ChatGPT 也成功做出了拍立得效果。之前测试 Gemini 3.0 Pro 时，其强大之处不仅在于编程，还在于只需提供截屏或视频即可复刻应用。这次我们同样给它一个视频，要求复刻古诗词生成网页。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第10张

https://chatgpt.com/canvas/shared/693b6d1b8fa881919c6298a4aed05581

相比之前 GPT-5.1 完全忽略上传视频的配色，这次它确实学到了。不过，由于 Gemini 生成的网页可以直接集成 AI 功能（通过 Gemini API），而 ChatGPT 尚未将 AI 引入这些生成网页，因此这里的诗歌依然是预设的那几首。

除了经典的编程测试和单页 HTML 生成，也有网友用它编写 Python 代码。输入的提示词是「write a python code that visualizes how a traffic light works in a one way street with cars entering at random rate.」（编写一个 Python 代码，模拟单行道交通灯的工作原理，并可视化随机速率进入的车辆）。他同时测试了 GPT-5.2 Extended Thinking 和 Claude Opus 4.5，结果显而易见。经常有读者问我们哪个模型编程最好，Claude 之所以备受开发者青睐，并非没有道理。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第11张

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第12张

下图是 GPT-5.2，来源：https://x.com/diegocabezas01/status/1999228052379754508

而且，Claude 模型此前最大的缺点可能是价格昂贵，Claude Opus 4.5 输入每百万 Token 5 美元，输出 25 美元。现在 GPT-5.2 的价格也水涨船高，相比 GPT-5.1 整体贵了约 40%，GPT-5.2 Pro 输入每百万 Token 21 美元，输出 168 美元。

在官方发布博客中，OpenAI 提到 GPT-5.2 在图像能力上也有所提升。GPT-5.2 Thinking 是目前最强大的视觉模型，在图表推理和软件界面理解方面的错误率降低约一半。官方还举例说明：对于一块模糊的主板图片，GPT-5.2 能添加更多带方框的标记，虽然仍有错误，但标记点远多于 GPT-5.1。然而，有网友用 Nano Banana Pro 去除图片标注后重新打上目标定位框，你觉得哪个更好？

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第13张

从左到右依次为 GPT-5.1、GPT-5.2、Nano Banana Pro｜图片来源：https://x.com/bcaine/status/1999212747213656072

个人感受是，ChatGPT 何必在别人擅长的领域「自取其辱」？Nano Banana 在处理图像方面目前堪称断层第一，即便 GPT-5.2 标注信息更多，但许多检测框定位仍不准确。编程和图像能力相比前代 GPT-5.1 有大幅提升，如果你是 ChatGPT 老用户，应该能直接感受到升级后的差异。但与其他模型对比，编程和图像的体验仍未能像 Nano Banana 推出时那样遥遥领先。

在审美网页设计方面，有网友分享了用 GPT-5.2 制作的前端页面，大家可以看看这次前端程序员是否又要被「祭天」了。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第14张

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第15张

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第16张

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第17张

相比之前烂大街的渐变紫，GPT-5.2 的设计水平确实进步了，但正如博主所说，它似乎特别喜欢在屏幕上画方框，层层叠叠的网格随处可见。关于设计能力，也有专门榜单显示，GPT-5.2 从十名开外的 GPT-5.1 一跃升至第三名，但得分最高的依然是 Gemini 3.0 Pro。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第18张

我们也让 GPT-5.2 为一家 AI 公司设计「高大上」的首页。结果发现，它确实酷爱方框，渐变紫又再次出现了。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第19张

提示词：You are the top 0.1% designer and developer for the world"s cutting-edge innovation on front-end design and development. You are tasked to create a full landing page with {Dither + Shaders} using {WebGL + ThreeJs} in the styling of an uploaded image for the AI company. - Focus mainly on the design part, not the development. Import all necessary files and libraries: Three.js、WebGL、GSAP、Any other animation libraries related to 3D development.

最后关于写作能力，据部分超前体验用户反馈，GPT-5.2 已能完成一些长篇小说创作。例如，当要求生成 50 个情节创意时，它会全部完成，而非像其他模型那样只生成一部分。当要求写一本 200 页的书时，ChatGPT 也没有直接拒绝，而是真正尝试构建全书结构，甚至生成了 PDF 文件。网友评论道：尽管书页内容较为单薄，篇幅也不长……毕竟目前它无法一口气写出一本可出版的小说，但能够开始执行、给出 50 个创意、写出 200 页内容，说明其思维深度足够。GPT-5.2 最引人注目的是它能很好地遵循指令……不仅是基本照做，而是真正完成描述的整个任务。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第20张

如今 GPT-5.2 已逐步推送给所有用户，你的上手实测体验如何？就个人而言，GPT-5.2 的升级不足以让我从 Gemini 转回。虽然它在多个榜单上刷新了成绩（无论是官方发布还是公开测试），但在实际使用中，生成 3D 程序时代码报错仍时有发生，整体审美风格也未能实现突破，而且价格还如此高昂。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第21张

网友锐评

Gemini 那边也并未停歇，持续给奥特曼施压。今天凌晨虽然没有发布新模型，但推出了重新设计的 Gemini Deep Research，并且可通过 API 访问，未来还将在 Gemini、Google 搜索、NotebookLM 中升级。

GPT-5.2 正式发布：性能提升与价格飙升并存，能否撼动 Gemini 地位？ 3.0 人工智能模型对比第22张

全新的 Gemini 深度研究 Agent 在人类最后的考试中，以 46.4% 击败了刚刚发布的 45.5% 的 GPT-5.2 Thinking（最高为 GPT-5.2 Pro 的 50.0%），并且在 Google 自研的 DeepSearchQA 和 BrowseComp 测试中均取得不错成绩。奥特曼的「红色警报」恐怕还要再亮一阵子了。