当前位置:首页 > 科技资讯 > 正文

GPT-5.2-Codex震撼发布:AI编程与网络安全新飞跃

震撼发布!GPT-5.2-Codex,OpenAI最新力作,专为复杂软件工程与真实世界挑战而生。

GPT-5.2-Codex震撼发布:AI编程与网络安全新飞跃 GPT-5.2-Codex AI智能体 网络安全 软件工程 第1张

从命名可见,GPT-5.2-Codex基于强大的GPT-5.2,实现多项关键升级:

·优化上下文压缩,提升长周期任务处理能力

·大型代码变更、重构与迁移性能更强

·原生Windows环境下编程能力显著增强

·网络安全能力达巅峰

据称,OpenAI团队已率先应用,成效显著。

GPT-5.2-Codex震撼发布:AI编程与网络安全新飞跃 GPT-5.2-Codex AI智能体 网络安全 软件工程 第2张

基准测试中,GPT-5.2-Codex在软件工程与终端测试中,击败GPT-5.1-Codex-Max、GPT-5.2及GPT-5.1。

GPT-5.2-Codex震撼发布:AI编程与网络安全新飞跃 GPT-5.2-Codex AI智能体 网络安全 软件工程 第3张

OpenAI博客多次强调,GPT-5.2-Codex网络安全能力前所未有。

上周,安全研究员利用GPT-5.1-Codex-Max+Codex CLI,发现React漏洞,导致源代码泄露。

GPT-5.2-Codex震撼发布:AI编程与网络安全新飞跃 GPT-5.2-Codex AI智能体 网络安全 软件工程 第4张

今日起,所有付费用户可体验GPT-5.2-Codex,API将在未来几周内开放。

GPT-5.2-Codex编程能力飙升,持久高效

简而言之,GPT-5.2-Codex是「强强联合」的结晶。

它不仅继承GPT-5.2的专业工作处理能力,还融合5.1-Codex-Max的AI编程与终端操作能力。

因此,它在长上下文理解、工具调用、事实准确性及原生上下文压缩等方面,均有显著提升。

支持长时间运行的编程任务,推理时更省token。

在SWE-Bench Pro与Terminal-Bench 2.0基准测试中,刷新SOTA记录,相较于GPT-5.1-Codex提升约6%。

GPT-5.2-Codex震撼发布:AI编程与网络安全新飞跃 GPT-5.2-Codex AI智能体 网络安全 软件工程 第5张

这些测试专为评估模型在真实终端环境中处理多样化任务的能力。

在原生Windows环境中,编程表现也显著提升,扩展了GPT-5.1-Codex-Max的能力。

改进后,Codex能在大型代码库中长时间工作,保持完整上下文。

这意味着复杂任务如大规模重构、代码迁移和功能开发等,都能可靠完成。

即使中途调整或失败,也能持续迭代。

此外,GPT-5.2-Codex视觉理解能力更强。

能更准确地理解截图、技术示意图、图表及UI界面。

GPT-5.2-Codex震撼发布:AI编程与网络安全新飞跃 GPT-5.2-Codex AI智能体 网络安全 软件工程 第6张

更厉害的是,它能直接读取设计稿,迅速转化为可运行功能原型。

三大跃迁:AI突破真实世界挑战

在OpenAI的核心网络安全评估中,可见「能力随时间跃迁」:

·GPT-5.1带来首次显著提升

·GPT-5.1-Codex实现第二次跃迁

·GPT-5.2则实现第三次跃迁

GPT-5.2-Codex震撼发布:AI编程与网络安全新飞跃 GPT-5.2-Codex AI智能体 网络安全 软件工程 第7张

OpenAI预测,未来模型将沿此趋势持续演进。

实战测试:一周挖出React高危漏洞

React团队在12月11日曝出React Server Components的三个安全漏洞。

Stripe旗下公司Privy的首席安全工程师Andrew MacPherson决定测试AI模型的能力。

他使用GPT-5.1+Codex CLI及其他编程智能体。意外的是,在复现与研究漏洞过程中,挖出关键React漏洞。

GPT-5.2-Codex震撼发布:AI编程与网络安全新飞跃 GPT-5.2-Codex AI智能体 网络安全 软件工程 第8张

具体操作如下:

起初尝试零样本学习分析模型判断补丁类型但无果。

随后采用高频、迭代提示方式。这些方法失败后,引导Codex按标准安全流程操作:搭建本地测试环境、分析潜在攻击面并通过模糊测试注入异常输入。

在复现原始React漏洞时,发现异常行为值得调查。

最终一周内促成新漏洞的发现并负责任地披露给React团队。

网友实测:编程与游戏表现

\n\t\t\t\t\t\t\t\t\t\t\t\t\n\t\t\t\t\t\t\t\t\n\n\n\n\n\n\n\n\n\n\n