震撼发布!GPT-5.2-Codex,OpenAI最新力作,专为复杂软件工程与真实世界挑战而生。
从命名可见,GPT-5.2-Codex基于强大的GPT-5.2,实现多项关键升级: ·优化上下文压缩,提升长周期任务处理能力 ·大型代码变更、重构与迁移性能更强 ·原生Windows环境下编程能力显著增强 ·网络安全能力达巅峰 据称,OpenAI团队已率先应用,成效显著。 基准测试中,GPT-5.2-Codex在软件工程与终端测试中,击败GPT-5.1-Codex-Max、GPT-5.2及GPT-5.1。 OpenAI博客多次强调,GPT-5.2-Codex网络安全能力前所未有。 上周,安全研究员利用GPT-5.1-Codex-Max+Codex CLI,发现React漏洞,导致源代码泄露。 今日起,所有付费用户可体验GPT-5.2-Codex,API将在未来几周内开放。 简而言之,GPT-5.2-Codex是「强强联合」的结晶。 它不仅继承GPT-5.2的专业工作处理能力,还融合5.1-Codex-Max的AI编程与终端操作能力。 因此,它在长上下文理解、工具调用、事实准确性及原生上下文压缩等方面,均有显著提升。 支持长时间运行的编程任务,推理时更省token。 在SWE-Bench Pro与Terminal-Bench 2.0基准测试中,刷新SOTA记录,相较于GPT-5.1-Codex提升约6%。 这些测试专为评估模型在真实终端环境中处理多样化任务的能力。 在原生Windows环境中,编程表现也显著提升,扩展了GPT-5.1-Codex-Max的能力。 改进后,Codex能在大型代码库中长时间工作,保持完整上下文。 这意味着复杂任务如大规模重构、代码迁移和功能开发等,都能可靠完成。 即使中途调整或失败,也能持续迭代。 此外,GPT-5.2-Codex视觉理解能力更强。 能更准确地理解截图、技术示意图、图表及UI界面。 更厉害的是,它能直接读取设计稿,迅速转化为可运行功能原型。 在OpenAI的核心网络安全评估中,可见「能力随时间跃迁」: ·GPT-5.1带来首次显著提升 ·GPT-5.1-Codex实现第二次跃迁 ·GPT-5.2则实现第三次跃迁 OpenAI预测,未来模型将沿此趋势持续演进。 React团队在12月11日曝出React Server Components的三个安全漏洞。 Stripe旗下公司Privy的首席安全工程师Andrew MacPherson决定测试AI模型的能力。 他使用GPT-5.1+Codex CLI及其他编程智能体。意外的是,在复现与研究漏洞过程中,挖出关键React漏洞。 具体操作如下: 起初尝试零样本学习分析模型判断补丁类型但无果。 随后采用高频、迭代提示方式。这些方法失败后,引导Codex按标准安全流程操作:搭建本地测试环境、分析潜在攻击面并通过模糊测试注入异常输入。 在复现原始React漏洞时,发现异常行为值得调查。 最终一周内促成新漏洞的发现并负责任地披露给React团队。
GPT-5.2-Codex编程能力飙升,持久高效
三大跃迁:AI突破真实世界挑战
实战测试:一周挖出React高危漏洞
网友实测:编程与游戏表现
\n\t\t\t\t\t\t\t\t\t\t\t\t\n\t\t\t\t\t\t\t\t\n\n\n\n\n\n\n\n\n\n\n
本文由主机测评网于2026-05-30发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546657.html