就在刚刚,OpenAI深夜震撼发布——GPT-5.2,全球AI王座再次易主!
三款全新模型,今日全部震撼上线:
· GPT‑5.2 Instant(即时版)
· GPT‑5.2 Thinking(思考版)
· GPT‑5.2 Pro(专业版)
作为地表最强通用模型,GPT-5.2专为解决那些让人头秃的「高难度知识型工作」而生。
在OpenAI公布的基准测试中,它几乎对Gemini 3 Pro实现了全方位碾压!
相比上一代,GPT-5.2在通用智能、超长文本理解、Agent工具调用以及视觉能力上,都实现了无死角的全面进化:
SWE-Bench Pro:狂砍55.6%高分;
LMArena代码竞技场:仅次于Claude Opus 4.5,稳坐全球第二把交椅;
ARC-AGI-2:GPT-5.2 Pro以52.9%的绝对优势登顶全球第一;
GDPval:覆盖44种职业知识,表现直接超越人类行业专家。
一句话总结:让它从头到尾(端到端)搞定复杂的现实世界任务,目前没有任何模型比它更强。
一个月前,GPT-5.1以「情商智商双高」的姿态登场,就迎面撞上了谷歌Gemini 3这个强劲对手。
此次更新正值媒体报道OpenAI内部进入「红色代码」紧急状态。
但OpenAI高管向媒体表示,不应将GPT-5.2视为对Gemini 3的回应。OpenAI应用CEO对记者说:
我们宣布进入「红色代码」紧急状态是为了向内部发出一个信号,我们想要集中力量办大事,这是一个确定优先事项和非优先事项的好办法。
总的来说,我们用于开发ChatGPT的资源增加了,我认为这有助于该模型的发布,但并不是它在这周发布的唯一原因。
这一次,GPT-5.2主打一个专业知识型AI,正所谓「打工人的最佳工作模型」。
GPT‑5.2 Thinking是用于现实世界专业用途的最佳模型。
在GDPval上,GPT‑5.2 Thinking创下了新的SOTA,并且是历史第一个表现超过人类专家水平的模型。
在编程上,GPT-5.2也是王者中的王者!
在SWE-Bench Pro上,GPT‑5.2 Thinking创下了55.6%的新纪录。
GPT‑5.2 Thinking是OpenAI目前最强的视觉模型,在图表推理和软件界面理解方面的错误率大约减少了一半。
GPT‑5.2 Thinking展示了其在长多轮任务中可靠使用工具的能力,在Tau2-bench Telecom上创造了98.7%的新纪录。
... (其他内容保持不变) ...本文由主机测评网于2026-05-25发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546134.html