AI技术的日新月异,让人应接不暇,每日更新已成为常态。
近期,Grok 4.1、Gemini 3 Pro相继发布,而今,OpenAI的GPT-5.1 Pro也低调登场,仅一纸官方简短公告便引起热议。
该模型主打「情商智商」双提升,Pro版本更是将这一优势推向新高度。
同日,OpenAI的全新代码模型GPT-5.1-Codex-Max也在Codex平台正式上线,专为软件、工程、数学等智能体任务训练。
该模型能力更强、反应更快,且更节省token,专为长时间、高强度的开发任务设计。
值得一提的是,GPT-5.1-Codex-Max是OpenAI首个支持压缩机制的模型,可跨多个上下文工作,适合项目重构、深度调试等任务。
目前,GPT-5.1 Pro已向所有Pro订阅用户开放,而GPT-5.1-Codex-Max则支持CLI、IDE扩展、云端及代码审查,API接口也将很快上线。
随着2025年接近尾声,AI领域的终极对决即将上演,GPT-5.1 Pro与Gemini 3 Pro之间的胜负备受期待。
GPT-5.1-Codex-Max在真实工程任务中经过专门训练,表现卓越,超越OpenAI此前所有模型。
在多项前沿编码评测中,它均表现优异,并在SWE-bench Verified上取得77.9%的高分。
此外,GPT-5.1-Codex-Max是OpenAI首个可在Windows环境中运行的模型,针对Codex CLI协作场景进行了优化。
GPT-5.1-Codex-Max不仅性能卓越,而且更经济。
在相同推理强度下,它比GPT-5.1-Codex表现更佳,且思考过程使用的token量减少约30%。
对于不敏感于延迟的任务,新增的「Extra High」推理强度可花费更多时间获取优质答案。
总体而言,token的节省意味着开发成本的降低,对开发者而言是重大利好。
「压缩」机制使GPT-5.1-Codex-Max能够处理因上下文过长而无法完成的任务。
例如复杂重构和长时间智能体循环等。
它通过自动整理历史内容、筛选保留最关键上下文,实现长时间跨度内的连贯性。
内部测试显示,GPT-5.1-Codex-Max能连续自主工作超过24小时。
这种长时间、连贯的任务能力是构建更通用、更可靠AI系统的关键。
尽管官方未单独发文介绍,但获得内测资格的用户纷纷分享体验感受。
第三方评估显示,GPT-5.1 Pro性能几乎与GPT-5持平。
本文由主机测评网于2026-05-12发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260544802.html