编程界战火重燃,新模型争霸赛开启!
Claude Opus 4.6发布仅仅15分钟,OpenAI迅速推出最新最强编程模型——
GPT-5.3-Codex。
最直观的感受是,这个新模型终于展现出了些许美学品味。
官方展示了两个Demo:一个赛车游戏、一个潜水游戏。设计颇具风格。
据悉,GPT-5.3-Codex在几乎没有人工干预的情况下,持续迭代这些游戏,累计消耗了数百万token。
在网页开发上,除了UI更加美观,对「意图」的理解也更强了。
即便Prompt给得不够明确,它也能自动补全逻辑,生成功能完备的网站。
就这些Demo来看,设计感确实比之前强了一截。
Computer use能力同样出众,现在已经能用来帮金融从业者直接制作PPT。
其他职场工作也能覆盖,尤其是在专业知识密集型任务上,写文档、做电子表格都没问题。
硬实力方面,官方给出的亮点如下:
更聪明:SWE-Bench Pro 57%,TerminalBench 2.0 76%,OSWorld 64%。
更可控:支持任务进行中的实时引导,可随时调整方向并获取更新。
更快速:完成相同任务时,所需token不到5.2-Codex的一半,单token速度提升超过25%。
更Agent:不只是更会写代码,计算机操作同样很强。
直接看这张对比表会更直观,几乎每一个维度,都比上一代有明显提升。
网友直呼过于刺激,昨天OpenAI刚被Anthropic拿广告狙了一枪,今天就对轰了回来。
一天之内,两个重量级编程模型。
评论区也迅速分成了Anthropic派和OpenAI派。
本文由主机测评网于2026-04-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260435384.html