当前位置:首页 > 科技资讯 > 正文

GPT-5:智能进化,重塑生活

经过长时间万众瞩目的等待,GPT-5终于在凌晨1点问世。在一个持续1小时10分钟的发布会上,OpenAI向全世界展示了其大模型的强大性能,不仅更加易用,还能准确捕捉并满足用户的真实需求。

正如Sam Altman在发布会上所言,GPT-5在各个领域的表现堪比博士级专家,让普通人也能完成以往难以想象的任务。这一突破令人瞩目。

GPT-5:智能进化,重塑生活 GPT-5 人工智能 大模型 智能进化 第1张

与两年前发布的GPT-4相比,大模型的应用体验已大为不同。如今,观众和用户已对模型理解网络梗图习以为常。然而,对于像我这样的AI产品日常用户而言,GPT-5的发布依然令人惊叹。

发布会的每一个瞬间都在传递着OpenAI的愿景:让大模型从令人惊喜或失望的大玩具,进化为生活中的可靠助手。正如你的手机一样,失去它你会感到不便、不习惯,甚至不安全。

让我通过几个发布会上的实例来阐释这一切是如何实现的。

当孩子请求解释流体力学中的伯努利公式时,以往AI可能提供一篇长文,而GPT-5则能迅速生成一个互动页面。

GPT-5:智能进化,重塑生活 GPT-5 人工智能 大模型 智能进化 第2张

如果你希望学习法语,GPT-5能生成一个类似多邻国的学习应用,帮助你背单词,甚至通过贪食蛇复习。不满意应用时,只需通过自然语言告诉GPT-5,它便会为你修改。

GPT-5:智能进化,重塑生活 GPT-5 人工智能 大模型 智能进化 第3张

如果你是一位创业公司的CFO,GPT-5能在3分钟内根据数据生成一个详细的财务状况互动演示板,仅需你提供约100字的描述。它能从零开始生成代码,自动优化并呈现效果。

GPT-5:智能进化,重塑生活 GPT-5 人工智能 大模型 智能进化 第4张

最惊人的是,演示中工作人员仅用3段提示词就让GPT-5生成了一个带射击小游戏的城堡3D模型,还能与城堡上的士兵聊天。点击气球即可发射弹药并伴随爆炸音效。

GPT-5:智能进化,重塑生活 GPT-5 人工智能 大模型 智能进化 第5张

从演示中可见,GPT-5已全面进化为专业产品的万能工具箱。

但最让我感动的是OpenAI在医疗健康方面的能力介绍。一位从三种癌症中康复的患者分享了GPT-5在抗癌过程中的帮助。

GPT-5:智能进化,重塑生活 GPT-5 人工智能 大模型 智能进化 第6张

她表示,在得到诊断结果后,医生提供了几种治疗方案供选择。在GPT-5的帮助下,她真正理解了面临的状况,并做出最适合自己的选择,最终战胜病魔。她难以想象没有GPT-5的专业建议如何理解医生的方案并做出选择。

看完发布会后,能明显感受到大模型技术已进入稳定发展阶段。GPT-5的发布标志着OpenAI没有跨越式发展的“魔法”,但接下来的AI巨头竞争将更加激烈。

性能介绍

模型系统

GPT-5不再是一个单一模型,而是一个模型系统:

  • • 自动切换器判断查询意图
  • • 简单问题路由到聊天版本(极速响应)
  • • 复杂问题路由到推理版本(深度思考)

支持文本和图像输入,支持函数调用和结构化输出。

GPT-5:智能进化,重塑生活 GPT-5 人工智能 大模型 智能进化 第7张

目前我的ChatGPT左上角模型选项已默认为“GPT-5”,下拉选项中不再见前代模型。正如奥特曼所言——GPT-5时代将无需繁琐的模型选择。

编码和写作

OpenAI称GPT-5为“迄今为止最强大的编码模型”,在复杂前端生成和大型代码库调试方面表现出色。它仅需一次提示即可创建美观且响应迅速的应用、网站和游戏。

GPT-5:智能进化,重塑生活 GPT-5 人工智能 大模型 智能进化 第8张

此外,OpenAI还称GPT-5为“迄今为止最强大的写作工具”,能写出引人入胜、富有文学深度和节奏感的文本。它更可靠地处理结构模糊的写作任务。

评估

GPT-5的全面智能化显著提升,体现在学术和人工评估基准测试中的表现上,特别是在数学、编码、视觉感知和健康领域。

  • 数学(AIME 2025无需工具测试得分94.6%)
  • 真实世界编码(SWE-bench Verified得分74.9%,Aider Polyglot得分88%)
  • 多模态理解(MMMU得分84.2%)
  • 健康(HealthBench Hard得分46.2%)

幻觉降低

在启用搜索的情况下,GPT-5出现事实性错误的概率比GPT-4降低约45%。在“思考”模式下,这一概率比OpenAI o3降低80%。

“高效”与“节省”

在OpenAI的评估中,GPT-5的输出token数量减少了50%至80%,这意味着用更少的思考时间实现了更大的价值。