经过无数次的等待,GPT-5终于面世,带来了AI技术的全新飞跃。
北京时间8月8日凌晨一点,OpenAI的夏季发布会拉开了帷幕,宛如一场科技界的春晚。
与以往不同,这次发布会进行了超过一个小时的直播,多位OpenAI的代表轮番上阵,从多个角度展示了GPT-5的强大性能。
重点来了:GPT-5在文本、WebDev和视觉感知能力领域均名列第一;在硬提示、编码、数学、创造力、长查询等方面也独占鳌头。在代号“峰会”的测试下,GPT-5取得了迄今为止最高的Arena分数,堪称名副其实的“屠榜”。
Sam Altman表示,GPT-4o就像中学生,而GPT-5则像大学生。他甚至将GPT-5比作第一部配备视网膜显示屏的iPhone:“你问它一个问题,可能会得到正确答案,也可能会得到一些疯狂的东西。与GPT-4相比,我感觉像是在与一名大学生对话,而GPT-5则让我真正感觉像是在与一位博士级别的专家交谈。”
尽管ChatGPT的周活跃用户已接近7亿,但OpenAI过去一段时间实际上并未拥有行业领先的前沿模型。现在,OpenAI相信GPT-5将使其重回排行榜榜首。
Altman在发布会上断言:“这是世界上编码能力最强的模型,是世界上写作能力最强的模型,也是世界上在医疗保健领域最强的模型。”
同时,OpenAI还宣布,除了代码能力爆表外,GPT-5的写作功底和回答健康相关问题的准确性也大幅提升。它不仅在智能上实现了“巨大飞跃”,还大幅减少了“一本正经胡说八道”的幻觉问题。它在理解和遵循指令方面表现更出色,拍马屁的倾向也大大降低了。
首先是本次更新的模型阵容,GPT-5系列包括GPT-5, mini, nano, chat四个版本。其中Chat版本旨在实现更自然、更智能的响应体验——你甚至可以用它来学习一门新的语言。
另外,现在当你打开ChatGPT网页时,会注意到GPT-5被呈现为一个单一模型,而不是一个常规模型外加一个独立的推理模型。
这背后其实是OpenAI开发的一个路由系统(router),它会自动为更复杂的查询切换到推理能力更强的版本,或者在你告诉它努力思考时也会这样做。(Altman称之前的模型选择界面是“一个非常混乱的烂摊子”。)
“AI幻觉”一直是大家吐槽的重灾区。好消息是,GPT-5在这方面下了大功夫,官方宣称其产生幻觉的可能性“显著降低”。具体来说:
在联网搜索时,GPT-5的回答出现事实错误的概率比GPT-4o低了45%。
在独立思考时,其回答出错的概率更是比OpenAI o3低了80%。
GPT-5还在新的ARC-AGI-2上进行了测试。除Grok 4(思考)外,它的表现优于所有主要模型。
此外,GPT-5还变得更加诚实。它不再轻易对用户撒谎或吹嘘自己能完成办不到的任务。当遇到不可能完成、指令不明确或缺少关键工具的任务时,它会更诚实地沟通自己的局限。
这次更新最有趣的一点莫过于引入了四种全新的“人格”模式,用户可以自由选择。它们分别是:
犬儒 (Cynic)
机器人 (Robot)
倾听者 (Listener)
学霸 (Nerd)
这些模式是可选的,你可以根据自己的喜好设定ChatGPT与你互动和回答问题的方式。想让它跟你抬杠还是像个耐心的朋友一样倾听?现在都可以由你决定。
随着代码能力的进一步提升,Altman预测GPT-5强大的编码能力将开启一个他称之为“软件按需生成”的时代。
在OpenAI的测试中,GPT-5在SWE-Bench, SWE-Lancer, 和Aider Polyglot等多个编码基准测试中的表现均优于任何其他模型。在人类最终测试中取得42%的成绩,在SWE基准测试中取得75%的成绩。
据模型安全研究负责人Alex Beutel介绍,为了解其安全风险,OpenAI对GPT-5进行了“超过五千小时”的测试。其中一个重点是“确保模型不会对用户撒谎”。
那么大家最关心的问题来了:怎么才能用上GPT-5呢?
好消息是,所有ChatGPT用户现在都可以立即免费体验GPT-5。这也是OpenAI第一次面向所有用户免费开放前沿模型。当然不同级别的用户权限不同:
Plus订阅用户在达到使用上限前可以有更多的使用次数。
Pro订阅用户则可以访问具备更强推理能力的GPT-5 Pro版本。
当用户达到使用上限后ChatGPT会自动切换到一个“迷你版”的GPT-5来处理后续的请求。同时随着GPT-5的上线它将正式取代GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.1和GPT-4.5等一系列旧模型。
本文由主机测评网于2026-04-20发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260439121.html