号称要全面超越 Gemini 的 GPT-5.2 于今日凌晨正式向所有用户开放。上个月刚刚退订 ChatGPT Plus 并转向 Gemini 的用户,现在是否值得为了 GPT-5.2 重新订阅?通过整理网友的真实体验以及 APPSO 的深度实测,或许能帮你找到答案。
这次终于没再把表格画错了。GPT-5.2 此次共更新了三款模型:GPT-5.2 Instant、Thinking 以及 Pro 模型。如果你此前习惯了 Gemini 3.0 Pro 每次回答前的深度思考过程,那么初次使用 GPT-5.2 Thinking/Pro 时,你会明显感觉到思考速度变慢,等待时间比以往更长。这也是目前多数提前体验的用户在社交平台上分享的共同感受。即 GPT-5.2 相较 5.1 在各方面均有提升,尤其是 GPT-5.2 Pro 非常适合处理复杂的专业推理任务,但代价是结果输出的过程更加漫长。
例如有用户分享,输入提示词「帮我绘制一张 HLE 测试成绩的图表」,GPT-5.2 Pro 足足花了 24 分钟才生成这张表。
好在所有数据都准确无误,图表中最好的结果依然显示为 Gemini 3.0 Pro。这也得益于 GPT-5.2 的知识截止日期更新至 2025 年 8 月,而 GPT-5.1 还停留在 2024 年 9 月,上个月发布的 Gemini 3.0 也只截止到 2025 年 1 月。
当我们使用 GPT-5.2 Thinking 生成 OpenAI 模型发布历史的图表时,耗时并不长,信息也比较准确。如果是简单任务,用 Thinking 模型与 Pro 模型的耗时差异会非常明显。
提示词:generate a chart graph of OpenAI model release over time
凭借强大的推理能力、最新的世界知识,以及多模态理解与推理能力的结合,GPT-5.2 迅速在大模型竞技场上跃升至第二名。GPT-5.2-High 在网页开发项目中排名第二,GPT-5.2 排名第六。相比之下,Gemini 3.0 Pro 排名第三,榜首依然是 Claude。
LMArena 官方也发布了一段实测视频,他们用 GPT-5.2 完成了一系列 3D 建模任务,完成度相当高。不过仍有网友调侃说:「这是回到 2003 年了吗?」
视频来源:https://x.com/arena/status/1999189215603753445
这种利用 three.js 实现的 3D 效果,极其考验模型的多模态理解、推理能力,以及编程开发和设计的优化。GPT-5.2 的升级幅度确实对得起这 0.1 的版本号提升。目前网友分享的大量测试大多集中在构建完整的 3D 引擎,GPT-5.2 的表现都可圈可点。例如有用户用 GPT-5.2 Thinking 的高难度推理模式,在单页文件中构建了一个支持交互控制、可导出 4K 分辨率的 3D 雪天冰块王国模型。
https://x.com/skirano/status/1999182295685644366
还有用户用 GPT-5.2 Pro 实现了波涛汹涌的哥特式城市建筑 3D 场景。
提示词:create a visually interesting shader that can run in twigl-dot-app make it like an infinite city of neo-gothic towers partially drowned in a stormy ocean with large waves.|来源:https://x.com/emollick/status/1999185085719887978?s=20
关于 3D 理解与推理能力,我们也使用了 Ian Goodfellow 在 Gemini 3.0 Pro 发布后测试过的提示词:上传一张图片,要求模型根据图片生成一个漂亮的体素艺术 Three.js 单页场景。
由于 ChatGPT 未在画布内直接生成,我们将对话框生成的代码复制到 HTML View 中打开,结果如右图所示。差异相当明显:ChatGPT 虽然识别了上传图片的内容(一棵粉红色的树、一片绿草地、灰色下沉区域和白色水流),但生成的 3D 动画相较于 Gemini 3.0 Pro 显得简陋不少。只能说,奥特曼发出的「红色警报」恰恰证明了 Gemini 的实力。
编程能力测试自然少不了经典的六边形小球物理运动。有博主加大了难度,使用全部闪着红光的 3D 小球。效果炫酷,许多网友询问实现方法;但也有网友指出,这些小球似乎不受重力控制。随后有人回复说,这是在模拟太空环境。
视频来源:https://x.com/flavioAd/status/1999183432203567339
还有 SVG 代码测试:骑自行车的鹈鹕。
有网友分享自己用 GPT-5.2 制作了一个森林火灾模拟器,可调节速度、片区大小和火焰燃烧范围。
我们制作了一个星球信号网页,布局与森林火情可视化网页如出一辙,左侧显示内容,星点换成了太空星球。
提示词:Create an interactive HTML, CSS, and JavaScript simulation of a satellite system that transmits signals to ground receivers. The simulation should show a satellite orbiting the Earth and periodically sending signals that are received by multiple
我们也用之前测试 Gemini 3 的拍立得项目来考验 GPT-5.2。输入同样的提示词,要求开发一个复古拍立得风格的网页相机应用。
提示词:开发一个具有复古拟物风格的单页相机应用。页面背景请设计为软木板或深色木纹材质,左下角固定一个纯 CSS 或 SVG 绘制的拟物化拍立得相机模型,其镜头区域实时显示用户摄像头画面;交互逻辑上,当用户点击快门按钮时,播放快门音效,并让一张带有白色边框的相纸从相机顶部缓慢吐出;请利用 CSS 滤镜让滑出的照片初始状态为高模糊且黑白,在 5 秒内平滑过渡到清晰全彩状态;最后,所有显影完成的照片必须支持自由拖拽,允许用户将其随意摆放在页面任意位置,且照片要有随机的微小旋转角度和阴影,点击某张照片时应将其置顶,从而形成一个逼真的自由照片拼贴墙。
令人意外的是,一次成型,ChatGPT 也成功做出了拍立得效果。之前测试 Gemini 3.0 Pro 时,其强大之处不仅在于编程,还在于只需提供截屏或视频即可复刻应用。这次我们同样给它一个视频,要求复刻古诗词生成网页。
https://chatgpt.com/canvas/shared/693b6d1b8fa881919c6298a4aed05581
相比之前 GPT-5.1 完全忽略上传视频的配色,这次它确实学到了。不过,由于 Gemini 生成的网页可以直接集成 AI 功能(通过 Gemini API),而 ChatGPT 尚未将 AI 引入这些生成网页,因此这里的诗歌依然是预设的那几首。
除了经典的编程测试和单页 HTML 生成,也有网友用它编写 Python 代码。输入的提示词是「write a python code that visualizes how a traffic light works in a one way street with cars entering at random rate.」(编写一个 Python 代码,模拟单行道交通灯的工作原理,并可视化随机速率进入的车辆)。他同时测试了 GPT-5.2 Extended Thinking 和 Claude Opus 4.5,结果显而易见。经常有读者问我们哪个模型编程最好,Claude 之所以备受开发者青睐,并非没有道理。
下图是 GPT-5.2,来源:https://x.com/diegocabezas01/status/1999228052379754508
而且,Claude 模型此前最大的缺点可能是价格昂贵,Claude Opus 4.5 输入每百万 Token 5 美元,输出 25 美元。现在 GPT-5.2 的价格也水涨船高,相比 GPT-5.1 整体贵了约 40%,GPT-5.2 Pro 输入每百万 Token 21 美元,输出 168 美元。
在官方发布博客中,OpenAI 提到 GPT-5.2 在图像能力上也有所提升。GPT-5.2 Thinking 是目前最强大的视觉模型,在图表推理和软件界面理解方面的错误率降低约一半。官方还举例说明:对于一块模糊的主板图片,GPT-5.2 能添加更多带方框的标记,虽然仍有错误,但标记点远多于 GPT-5.1。然而,有网友用 Nano Banana Pro 去除图片标注后重新打上目标定位框,你觉得哪个更好?
从左到右依次为 GPT-5.1、GPT-5.2、Nano Banana Pro|图片来源:https://x.com/bcaine/status/1999212747213656072
个人感受是,ChatGPT 何必在别人擅长的领域「自取其辱」?Nano Banana 在处理图像方面目前堪称断层第一,即便 GPT-5.2 标注信息更多,但许多检测框定位仍不准确。编程和图像能力相比前代 GPT-5.1 有大幅提升,如果你是 ChatGPT 老用户,应该能直接感受到升级后的差异。但与其他模型对比,编程和图像的体验仍未能像 Nano Banana 推出时那样遥遥领先。
在审美网页设计方面,有网友分享了用 GPT-5.2 制作的前端页面,大家可以看看这次前端程序员是否又要被「祭天」了。
相比之前烂大街的渐变紫,GPT-5.2 的设计水平确实进步了,但正如博主所说,它似乎特别喜欢在屏幕上画方框,层层叠叠的网格随处可见。关于设计能力,也有专门榜单显示,GPT-5.2 从十名开外的 GPT-5.1 一跃升至第三名,但得分最高的依然是 Gemini 3.0 Pro。
我们也让 GPT-5.2 为一家 AI 公司设计「高大上」的首页。结果发现,它确实酷爱方框,渐变紫又再次出现了。
提示词:You are the top 0.1% designer and developer for the world"s cutting-edge innovation on front-end design and development. You are tasked to create a full landing page with {Dither + Shaders} using {WebGL + ThreeJs} in the styling of an uploaded image for the AI company. - Focus mainly on the design part, not the development. Import all necessary files and libraries: Three.js、WebGL、GSAP、Any other animation libraries related to 3D development.
最后关于写作能力,据部分超前体验用户反馈,GPT-5.2 已能完成一些长篇小说创作。例如,当要求生成 50 个情节创意时,它会全部完成,而非像其他模型那样只生成一部分。当要求写一本 200 页的书时,ChatGPT 也没有直接拒绝,而是真正尝试构建全书结构,甚至生成了 PDF 文件。网友评论道:尽管书页内容较为单薄,篇幅也不长……毕竟目前它无法一口气写出一本可出版的小说,但能够开始执行、给出 50 个创意、写出 200 页内容,说明其思维深度足够。GPT-5.2 最引人注目的是它能很好地遵循指令……不仅是基本照做,而是真正完成描述的整个任务。
如今 GPT-5.2 已逐步推送给所有用户,你的上手实测体验如何?就个人而言,GPT-5.2 的升级不足以让我从 Gemini 转回。虽然它在多个榜单上刷新了成绩(无论是官方发布还是公开测试),但在实际使用中,生成 3D 程序时代码报错仍时有发生,整体审美风格也未能实现突破,而且价格还如此高昂。
网友锐评
Gemini 那边也并未停歇,持续给奥特曼施压。今天凌晨虽然没有发布新模型,但推出了重新设计的 Gemini Deep Research,并且可通过 API 访问,未来还将在 Gemini、Google 搜索、NotebookLM 中升级。
全新的 Gemini 深度研究 Agent 在人类最后的考试中,以 46.4% 击败了刚刚发布的 45.5% 的 GPT-5.2 Thinking(最高为 GPT-5.2 Pro 的 50.0%),并且在 Google 自研的 DeepSearchQA 和 BrowseComp 测试中均取得不错成绩。奥特曼的「红色警报」恐怕还要再亮一阵子了。
本文由主机测评网于2026-03-04发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260328647.html