当前位置:首页 > 科技资讯 > 正文

GPT-5震撼发布:AI新时代全面升级

经过无数次的等待,GPT-5终于面世,带来了AI技术的全新飞跃。

北京时间8月8日凌晨一点,OpenAI的夏季发布会拉开了帷幕,宛如一场科技界的春晚。

与以往不同,这次发布会进行了超过一个小时的直播,多位OpenAI的代表轮番上阵,从多个角度展示了GPT-5的强大性能。

GPT-5震撼发布:AI新时代全面升级 GPT-5 AI升级 多领域提升 幻觉减少 第1张

重点来了:GPT-5在文本、WebDev和视觉感知能力领域均名列第一;在硬提示、编码、数学、创造力、长查询等方面也独占鳌头。在代号“峰会”的测试下,GPT-5取得了迄今为止最高的Arena分数,堪称名副其实的“屠榜”。

GPT-5震撼发布:AI新时代全面升级 GPT-5 AI升级 多领域提升 幻觉减少 第2张

Sam Altman表示,GPT-4o就像中学生,而GPT-5则像大学生。他甚至将GPT-5比作第一部配备视网膜显示屏的iPhone:“你问它一个问题,可能会得到正确答案,也可能会得到一些疯狂的东西。与GPT-4相比,我感觉像是在与一名大学生对话,而GPT-5则让我真正感觉像是在与一位博士级别的专家交谈。”

尽管ChatGPT的周活跃用户已接近7亿,但OpenAI过去一段时间实际上并未拥有行业领先的前沿模型。现在,OpenAI相信GPT-5将使其重回排行榜榜首。

Altman在发布会上断言:“这是世界上编码能力最强的模型,是世界上写作能力最强的模型,也是世界上在医疗保健领域最强的模型。”

同时,OpenAI还宣布,除了代码能力爆表外,GPT-5的写作功底和回答健康相关问题的准确性也大幅提升。它不仅在智能上实现了“巨大飞跃”,还大幅减少了“一本正经胡说八道”的幻觉问题。它在理解和遵循指令方面表现更出色,拍马屁的倾向也大大降低了。

告别“幻觉”,AI更可靠了

首先是本次更新的模型阵容,GPT-5系列包括GPT-5, mini, nano, chat四个版本。其中Chat版本旨在实现更自然、更智能的响应体验——你甚至可以用它来学习一门新的语言。

GPT-5震撼发布:AI新时代全面升级 GPT-5 AI升级 多领域提升 幻觉减少 第3张

另外,现在当你打开ChatGPT网页时,会注意到GPT-5被呈现为一个单一模型,而不是一个常规模型外加一个独立的推理模型。

这背后其实是OpenAI开发的一个路由系统(router),它会自动为更复杂的查询切换到推理能力更强的版本,或者在你告诉它努力思考时也会这样做。(Altman称之前的模型选择界面是“一个非常混乱的烂摊子”。)

“AI幻觉”一直是大家吐槽的重灾区。好消息是,GPT-5在这方面下了大功夫,官方宣称其产生幻觉的可能性“显著降低”。具体来说:

在联网搜索时,GPT-5的回答出现事实错误的概率比GPT-4o低了45%。

GPT-5震撼发布:AI新时代全面升级 GPT-5 AI升级 多领域提升 幻觉减少 第4张

在独立思考时,其回答出错的概率更是比OpenAI o3低了80%。

GPT-5震撼发布:AI新时代全面升级 GPT-5 AI升级 多领域提升 幻觉减少 第5张

GPT-5还在新的ARC-AGI-2上进行了测试。除Grok 4(思考)外,它的表现优于所有主要模型。

GPT-5震撼发布:AI新时代全面升级 GPT-5 AI升级 多领域提升 幻觉减少 第6张

此外,GPT-5还变得更加诚实。它不再轻易对用户撒谎或吹嘘自己能完成办不到的任务。当遇到不可能完成、指令不明确或缺少关键工具的任务时,它会更诚实地沟通自己的局限。

这次更新最有趣的一点莫过于引入了四种全新的“人格”模式,用户可以自由选择。它们分别是:

犬儒 (Cynic)

机器人 (Robot)

倾听者 (Listener)

学霸 (Nerd)

这些模式是可选的,你可以根据自己的喜好设定ChatGPT与你互动和回答问题的方式。想让它跟你抬杠还是像个耐心的朋友一样倾听?现在都可以由你决定。

“软件按需生成”时代来临?代码能力逆天

随着代码能力的进一步提升,Altman预测GPT-5强大的编码能力将开启一个他称之为“软件按需生成”的时代。

在OpenAI的测试中,GPT-5在SWE-Bench, SWE-Lancer, 和Aider Polyglot等多个编码基准测试中的表现均优于任何其他模型。在人类最终测试中取得42%的成绩,在SWE基准测试中取得75%的成绩。

更安全,更“诚实”

据模型安全研究负责人Alex Beutel介绍,为了解其安全风险,OpenAI对GPT-5进行了“超过五千小时”的测试。其中一个重点是“确保模型不会对用户撒谎”。

如何用上 GPT-5

那么大家最关心的问题来了:怎么才能用上GPT-5呢?

好消息是,所有ChatGPT用户现在都可以立即免费体验GPT-5。这也是OpenAI第一次面向所有用户免费开放前沿模型。当然不同级别的用户权限不同:

Plus订阅用户在达到使用上限前可以有更多的使用次数。

Pro订阅用户则可以访问具备更强推理能力的GPT-5 Pro版本。

当用户达到使用上限后ChatGPT会自动切换到一个“迷你版”的GPT-5来处理后续的请求。同时随着GPT-5的上线它将正式取代GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.1和GPT-4.5等一系列旧模型。