智东西11月20日报道,近日,OpenAI推出了其最新研发成果——智能编程模型GPT‑5.1‑Codex‑Max。这款模型建立在OpenAI最新推理技术之上,专注于软件工程、研究及数学等领域的复杂任务。
与此同时,OpenAI也将GPT-5 Pro升级至GPT-5.1 Pro,据称该模型在写作与数据分析方面的能力较前一代有所提升。不过,OpenAI并未透露更多关于GPT-5.1 Pro的详细信息。
GPT‑5.1‑Codex‑Max能够在单一任务中流畅处理数百万个token,跨多个上下文窗口运行。这得益于一项名为压缩(compaction)的技术:当模型接近上下文窗口限制时,会自动压缩上下文,保留关键信息,并赋予对话新的上下文窗口,直至任务完成。
这一模型的研发由OpenAI研究科学家Noam Brown领导,他在OpenAI专门从事测试时计算与推理的研究。
OpenAI认为,能够持续进行连贯工作,是迈向更通用、更可靠AI系统的基础能力。GPT-5.1-Codex-Max可以独立工作数小时。在内部评估中,GPT-5.1-Codex-Max甚至能针对同一任务连续工作24小时,实现持续迭代、修复测试失败并成功交付结果。
在多个编程基准测试中,GPT‑5.1‑Codex‑Max的表现均优于前代GPT‑5.1‑Codex。此外,该模型也是OpenAI首个适用于Windows环境编程操作的模型。
在中等推理强度下,GPT‑5.1‑Codex‑Max完成任务时所使用的思考token比GPT‑5.1‑Codex少约30%,但仍能取得更高的准确性。对于追求质量而非敏感延迟的任务,还可以开启超高强度推理,让模型花更多时间思考,输出更优解。
OpenAI预计,这种token效率的提升将为开发者带来实际成本节约。
目前,GPT-5.1-Codex-Max已在Codex中提供,可用于CLI、IDE扩展、云端和代码审查,API访问也即将推出。
OpenAI展示了由GPT-5.1-Codex-Max创建的多个网页应用。根据提示词,GPT-5.1-Codex-Max构建了一个完全在浏览器中运行的CartPole(倒立摆)强化学习沙箱。
用户不仅可以观察倒立摆的动态,还能通过内置的策略梯度控制器直接训练模型,使AI在实验过程中不断优化策略。
它提供了神经网络可视化功能,在训练或推理时,用户可以实时观察模型的权重和激活状态,直观理解决策机制。
此外,应用界面清晰地展示了每个回合的步数和奖励,并记录了上一次存活时间及历史最佳存活时间,使训练过程和成果一目了然。
...(此处省略部分原文内容)
本文由主机测评网于2026-05-12发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260544815.html