在GPT-4发布两年之后,经过多次推迟的GPT-5终于面世。北京时间8月8日凌晨1点,OpenAI举办了一场超过一小时的发布会,全面展示了GPT-5在智能水平、编程能力、任务推理等方面的性能提升。
尽管GPT-5带来了诸多改进,但相比GPT-3到GPT-4所带来的全面升级,许多人认为这次的新品并未带来太多惊喜。无论是从发布会的规模、产品亮点,还是性能升级来看,都显得较为普通,相较于当前主流的SOTA模型,其提升幅度并不显著。
然而,价格策略成为了此次发布会的最大亮点。GPT-5的API调用价格仅为前几天发布的Claude Opus 4.1的1/15,远低于Gemini 2.5 Pro,在大模型市场上展现出极高的性价比。
近年来,随着AI工具在各行业的普及,人们既期待AI能够取代重复繁琐的工作,又担心自己会被AI取代,这也是GPT-5发布前备受关注的原因之一。但从目前GPT-5的能力突破来看,人类智能在通往AGI的路上仍有很长的路要走。
回顾过去几年GPT的迭代历程,它不仅是众多AI公司争相效仿的对象,也是整个大模型行业发展的缩影。尽管此次GPT-5的表现相对平庸,打破了外界对大模型技术持续突破的惯性认知,但在某种程度上也在多数人的意料之中。
相比AI兴起阶段大众对大模型技术的过高期望,市场上关于大模型参数突破的讨论正逐渐减弱。相比技术突破,人们更加关心的是AI如何更有效地融入日常生活。
自2018年OpenAI发布首个大模型GPT-1以来,GPT系列已经走过了七个年头。
2020年,GPT3的出现使得大模型参数规模从15亿直接扩展到1750亿,通过“上下文学习”能力摆脱了对大量标注数据的依赖,使大模型开始作为效率工具使用。
两年后,基于GPT-3.5构建的对话式模型ChatGPT上线,进一步推动大模型走进C端日常,成为通用AI应用的重要转折点。
随后GPT-4的全面升级不仅实现了万亿级模型参数,还使大模型在单纯文本输出的基础上实现了图像的交互提升。
在过去的一年里,GPT发布的多款模型都在围绕图像、语音互动等多模态能力进行迭代;deepseek的推出将推理模型带入大众视野。去年OpenAI接连发布了O1、O3系列产品,将复杂推理作为性能优势,开始强调对科学、编程等专业领域的协助能力。
与此同时,关于大模型参数量的宏大叙事逐渐消失,转变为对多模态、长文本等细节能力的追求以及对医疗、教育等落地场景的讨论。正因如此,大模型产品形态也开始从单一模型转向多版本并行。
截至目前,OpenAI已构建起由GPT系列(主打对话交互)、O系列(聚焦复杂推理)以及图像/视频生成模型(支撑多模态创作)组成的三大产品矩阵。
本次升级的GPT-5中,GPT进一步统一了O系列的推理能力和GPT的快速响应。与deepseek在模型使用时需要自主选择是否使用深度思考模式不同,GPT-5能够自动判断对话类型。
OpenAI核心产品发布时间线
此外,在此次发布会中,OpenAI首次同时推出了四个版本:标准版GPT-5、轻量级的GPT-5 mini与GPT-5 nano以及面向企业与高级订阅用户的GPT-5 Pro(需企业授权或月付200美元)。这进一步加深了按需定制、分层定价的SaaS化路径演进。
这种转变也意味着对于AI公司来说竞争的门槛不再仅仅是技术突破还包括是否具备构建产品体验、搭建商业模型、整合跨界资源的综合能力。
DeepSeek上线带来的用户量激增不仅向外界证明了开源模型的商业化可行性也进一步加深了大模型公司对“先发优势”的重视。当模型性能差距趋于收敛前期对于用户心智的争夺上升为第一要义。
正因如此随着GPT-5问世的风声不断最近一段时间各大厂商开始纷纷加速竞跑相继推出新品。
字节在两个月前将豆包更新至1.6版本阿里也在昨日推出了Qwen3-4B-Instruct-2507与Thinking-2507双版本MiniMax近几日发布了新一代语言生成模型Speech 2.5智谱也在上月底发布旗舰模型GLM-4.5……一场集中式更新潮给沉静许久的大模型赛道掀起了又一波浪潮。
但当我们把时间拉长来看这波密集的模型上新趋势距离上一次“百模大战”的盛景已经过去了一年多。
大模型的更新趋势正在逐渐放缓。不仅如此相比GPT-3到GPT-4参数暴涨、多模态突破、上下文显著增强的跃迁近期多款新品的提升幅度也显得颇为有限大多数模型的升级和GPT-5一样乏善可陈。
很多人把背后的原因归结为数据瓶颈。
去年万众瞩目的Orion项目开发时长超过了18个月原计划作为GPT-5推出。但在验证时性能却远未达到预期最终只能被降级成GPT-4.5在今年2月默默上线。
据业内人士称Orion之所以失败最核心的原因在于团队摸到了预训练阶段的天花板。随着训练数据的不断扩充高质量网络数据存量不断减少直接导致了模型训练效果的下降。
除此之外随着大模型参数量不断增加硬件水平所带来的掣肘也在越发放大。据媒体报道有开发人员透露OpenAI在去年年底推出的推理模型O3之所以能够实现核心的性能提升主要依赖于使用更多的英伟达芯片进行开发。
更进一步的问题在于大众对于AI幻觉、AI味的抵制正在呈现更为激进的态势。
GPT-5发布前夕奥特曼在社交平台分享了模型对话能力的演示。但出乎意料的是评论区关注的焦点已不再是性能指标而是GPT频繁使用破折号的语言习惯。
此前OpenAI在今年2月推出的GPT 4.5核心性能升级也在于提升模型情商减少AI痕迹。与此同时在有关GPT-5的权威测评数据中也表示出AI事实性幻觉的大幅减少。
但正如众多网友所吐槽的那样相比较数学能力的准确度提升GPT-5在写作流畅度、情商表现上却远不如GPT 4.5。
一直以来围绕ChatGPT的订阅收费、API接口调用是OpenAI的重要盈利来源但随着今年AI Agent 的大量涌现大模型公司的商业化重心开始发生了迁移。
上半年OpenAI发布了两款基于ChatGPT的AI Agent一是可以代替用户操作浏览器自主执行任务的Operator;二是可以辅助做深入研究生成专业研究报告的Deep Research。
据The Information披露相关文件表示OpenAI已告知投资者预计到2025年末AI Agent及其他新产品的合计销售额将超越ChatGPT。
与此同时对比去年全年37亿美元的营收OpenAI预计今年的营收能达到127亿美元相比去年的营收估值足足增长了2倍以上。背后最重要的驱动力之一就是AI Agent。
事实上AI Agent的商业化爆发并非OpenAI独享。以辅助编程为核心的“vibe coding”编辑器Cursor便是典型代表。
凭借多行智能重构、代码自动补全和代码库查询等功能Cursor付费用户已超36万最新估值较年初激增三倍。与此同时曾引发全网“账号抢购”热潮的Manus尽管被曝“出逃海外”依然反映出AI Agent在垂直细分领域的极高用户粘性。
...
本文由主机测评网于2026-04-21发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260439227.html