当前位置:首页 > 科技资讯 > 正文

GPT-5震撼发布:新一代旗舰模型全面升级

震撼来袭!OpenAI今天凌晨1点发布了万众瞩目的新一代旗舰模型GPT-5,即日起向所有免费、Plus、Pro、Team用户开放,企业和教育用户也将在未来一周内获得访问权限。一经发布,GPT-5便迅速登上大模型竞技场榜首,在文本、编程、数学等领域均表现卓越。

GPT-5震撼发布:新一代旗舰模型全面升级 GPT-5 旗舰模型 按需思考 多模态 第1张

GPT-5将非推理模型与推理模型融为一体,支持“按需思考”,根据任务难度自行判断是否进行思考,并提供合适的回答。此外,它还拥有4种“人格”,分别为愤世嫉俗者、机器人、倾听者和书呆子。

OpenAI CEO Sam Altman认为,GPT-5已经达到了博士级别的智能,与其对话就像是与一位在任何领域都拥有博士学位的专家沟通。GPT-5不仅能回答问题,还能完成日常规划、发送邀请函、采购物资等任务。

OpenAI研究员Tina Kim在发布中称:“有了GPT-5,我们将淘汰所有旧模型。”GPT-5集成了多模态、推理等多种能力,相当于融合GPT和o系列模型,用户无需再为复杂的产品族选择纠结。

在多项基准测试中,GPT-5超过了OpenAI o3、GPT-4o等最强大的模型,在数学、编码、视觉感知和健康方面表现尤其出色。凭借GPT-5-pro的扩展推理,该模型还在科学知识基准测试GPQA上获得了新的SOTA,无需工具即可得分88.4%。

GPT-5震撼发布:新一代旗舰模型全面升级 GPT-5 旗舰模型 按需思考 多模态 第2张

不过,GPT-5也可能是OpenAI历史上最复杂的模型家族之一,拥有GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四个版本。免费用户的GPT-5用量有限,超过限额后将自动转至GPT-5-mini。GPT-5-pro仅供Pro订阅用户使用,可凭借扩展推理功能提供更全面、更准确的答案。

GPT-5、GPT-5-mini、GPT-5-nano三款模型也提供API服务。GPT-5的输入、输出价格分别为每百万token 1.25美元/10美元,GPT-5-mini的定价为GPT-5的1/5,而GPT-5-nano的定价为GPT-5的1/25。与主要竞争对手Anthropic和谷歌相比,OpenAI的GPT-5模型对于开发人员来说成本相当甚至更低。

GPT-5震撼发布:新一代旗舰模型全面升级 GPT-5 旗舰模型 按需思考 多模态 第3张

发布会上,Altman分享了一组数据:32个月前,OpenAI发布了ChatGPT,并在发布首周获得超100万用户。而如今,ChatGPT在全球范围内已有超过7亿用户。GPT-5是对GPT-4的一次重大升级,也是迈向AGI的重要一步。

但GPT-5不是AGI。Altman称:“我有点讨厌‘通用人工智能(AGI)’这个词,因为现在每个人都用它来指代略有不同的事物,但GPT-5是朝着真正强大的模型迈出的重要一步。我们仍然缺少一些非常重要的东西。”这一重要的东西就是模型在部署过程中能够持续学习,而GPT-5却没有。

按需思考规避“过度思考”,编程能力获认可

现场演示中,OpenAI展示了GPT-5按需思考的能力。工作人员让GPT-5解释伯努利现象,这对其而言相对简单。无需思考,GPT-5迅速给出答案。而当提出更复杂的任务时,如创建动态SVG演示图,GPT-5会自动进行思考并完成任务。

GPT-5震撼发布:新一代旗舰模型全面升级 GPT-5 旗舰模型 按需思考 多模态 第4张

研发人员称,GPT-5是迄今为止最好的编程模型。比如他让GPT-5建立了一个学习法语的网络应用,并成功嵌入了一款贪吃蛇游戏。

GPT-5震撼发布:新一代旗舰模型全面升级 GPT-5 旗舰模型 按需思考 多模态 第5张

为了进一步证明GPT-5在生产场景中的编程能力,OpenAI邀请了Cursor联合创始人兼首席执行官Michael Truell进行现场演示。Truell认为,GPT-5在API调用中展现出了不错的稳定性。

多项基准测试实现业界SOTA

OpenAI称,GPT‑5是其迄今为止在编码和智能体任务方面表现最佳的模型。它在编码基准测试和实际应用场景中均优于o3。

GPT-5震撼发布:新一代旗舰模型全面升级 GPT-5 旗舰模型 按需思考 多模态 第6张

同时,GPT‑5在事实性方面也表现优异。在事实准确性基准测试中,其错误率仅为o3的五分之一。

解决“阿谀奉承”问题

OpenAI引入了新的安全训练形式——安全完成(safe completions),教会模型尽可能给出最有用的答案,同时保持在安全范围内。

此外,GPT‑5 Pro的推出进一步提升了模型性能。

结语:性能提升待验证

虽然GPT‑5的发布引起了广泛关注,但其真实性能尚待市场反馈。不过,OpenAI的估值已经飙升。