当前位置:首页 > 科技资讯 > 正文

GPT-5发布:产品化之路与国产大模型的“自给自足”挑战

GPT-5正式发布,尽管在测试集上取得优异成绩,但用户反馈却褒贬不一,许多用户仍希望保留GPT-4。OpenAI希望通过增加模型路由功能,以不同模型和算力成本满足各种用户需求。

从目前体验来看,OpenAI追求“统一模型”的努力仍任重道远。GPT-5并未带来模型能力的显著突破或技术范式的更新,更多的是在产品化创新方面发力——它减少了幻觉,更易于使用,能协助用户解决更多具体问题,但在能力上并无新突破,也没有彻底解决大模型的某个结构性缺陷。近日,有外媒报道DeepSeek正在使用国产芯片训练最新模型,但新模型的发布日期尚未确定。GPT-5的发布似乎表明,大模型能力上限已逼近瓶颈。面对这堵“Transformer能力边界之墙”,OpenAI选择将现有能力产品化到极致,而DeepSeek则在追求模型上限的竞争压力变缓时,正开启“自给自足”的支线任务。

致力于用AGI将人类社会带入“极度富足”的OpenAI在打造超级APP的路上渐行渐远,营收和估值一路飙升;而希望探索AI能力上限、推进技术普惠的DeepSeek,则需要解决不同的挑战。

或许多年以后,当人们回顾大模型行业发展的时间线时会发现,DeepSeek R1和GPT-4o的发布是多个发展线路的交汇点,而GPT-5的发布则标志着这些线路的分化。

01 性能霸榜却未达预期的GPT-5,加速产品化

市场期待的是一次足以重新定义人机交互的范式转移。然而,最终结果更像是一次常规升级。虽然GPT-5模型参数更多、训练数据更广、基准测试得分更高,但在核心智能层面并未展现出革命性进步。纽约大学名誉教授加里·马库斯曾以“姗姗来迟、过度炒作、平庸无奇”三个词概括GPT-5的表现。

他分析指出,GPT-5未能根除大型语言模型固有的缺陷。它仍会在某些时候编造事实,即所谓的“幻觉”问题。面对需要多步逻辑推理的任务时,它仍会犯错。在提供现实世界的理解的多模态性能上,也没有质的提升。

这些问题在GPT-4时代就已存在,业界曾希望GPT-5能提供解决方案,但现实是OpenAI选择对现有框架进行修补和优化。然后在此基础上提供一个产品化更好、更易于使用的模型工具。

GPT-5发布:产品化之路与国产大模型的“自给自足”挑战 GPT-5 产品化 国产大模型 自给自足 第1张

如果说核心智能的停滞是技术专家和深度用户的感受,那么其在多模态能力上有限的进步则让技术爱好者感到失望。在GPT-5发布之前,一个普遍共识是下一代人工智能的决胜场将是多模态。人们想象中的GPT-5应能无缝接收、理解和融合处理来自文本、图像、音频、视频等多种渠道的信息。然而,现实中的GPT-5在多模态交互上的表现更像是一个优化版的GPT-4V。它能精准完成描述性任务如识别照片中的物体,但一旦任务转向理解,其能力边界便显现。

作为将Transformer算法能力和语言最早结合、用ChatGPT开创大模型时代并将强化学习融入大模型训练过程、捅破大模型推理能力天花板的OpenAI一直是业界标杆。但GPT-5发布后除性能“未达预期”外获得关注的特性都是产品级别的变化。

OpenAI希望通过“模型路由”功能让用户避免在众多模型中选择降低使用门槛并合理化算力分配以便在有限算力资源下为更多用户提供高质量服务。

按OpenAI的说法虽然GPT-5大幅降低了模型幻觉但在基础数理问题和现实世界理解上表现难令人满意仍会出现明显错误。相反可能因训练数据中加入更多生产力相关内容在情商上有很大退步引发普通聊天用户用取关威胁GPT-4o“返场”。

GPT-5表现出OpenAI在大模型能力突破的“躺平”几乎间接宣布“大模型能力墙”已到来或至少是大模型技术突破进入平缓期。未来模型能力能否重回“GPT-3到GPT-4o”这样的快车道依赖于研究人员在底层技术的突破和创新。

OpenAI前首席科学家Ilya曾在2023年底的访谈中总结AI技术发展趋势似乎预言了这一刻的到来。

GPT-5发布:产品化之路与国产大模型的“自给自足”挑战 GPT-5 产品化 国产大模型 自给自足 第2张

“不同研究人员和项目会在一段时间内朝不同方向前进当人们发现技术有效后会快速向那个方向收敛之后可能回归百花齐放的状态”

02 梁文锋能否抓住时机完成国产大模型的“自给自足”

若Transformer技术墙已到来对DeepSeek还能有何合理期待?纵观DeepSeek的产品发布历史每一个重量级发布都在其时间线上解决了大模型技术上的某个重要问题。

2024年5月的DeepSeek-V2系列革命性处理长上下文处理效率首创MLA机制支持高达128K token的处理同时以极低API定价引发中国AI巨头价格战显著提升大模型可负担性和实际部署潜力。

2024年12月的DeepSeek-V3以MoE架构登场针对推理速度痛点实现每秒60token的3倍加速性能达到GPT-4o的同时保持资源高效几乎拉平开源和闭源模型性能差距。

2025年1月的DeepSeek-R1专注于推理能力提升在AIME和MATH任务上匹敌或超越OpenAI的o1模型成本远低于当时所有模型通过App登顶美国App Store解决高端AI访问壁垒加速开源AI全球普及与民主化。

V3和R1让DeepSeek彻底出圈后它似乎从一家发源于量化成名于大模型的科技公司变成肩负更多使命的科技公司。

据外媒报道DeepSeek正将最先进大模型的训练转移到国产芯片上。大模型的国产化之路远比想象困难在地缘政治等因素影响之下若无法摆脱对英伟达GPU的依赖所有中国AI公司头顶永远悬着一把达摩克里斯之剑。

此时OpenAI发布的GPT-5暗示以Transformer为核心的大模型技术发展曲线暂时变缓。这给包括DeepSeek在内的科技公司一个信号——除不断提升模型性能外可放心探索其他领域。

实现前沿性能大模型从训练到推理的国产化即便对于顶尖AI公司来说难度不亚于研发全新原子弹。需解决的技术问题可能比之前发布的所有模型所需解决的难题还要多。

首先是国产GPU性能与英伟达GPU单卡性能相比还有接近代际的差距。即便国产GPU通过更密集的互联技术尽力弥补单卡性能差距但要与硅谷大模型采用的英伟达“10万卡集群”竞争在国产GPU上训练顶尖模型需面对难以想象的工程难题。

大模型研发离不开如PyTorch或TensorFlow等开源框架这些框架原本为国际主流硬件优化。若DeepSeek要国产化需将软件栈迁移到本土硬件上这意味着要重写或修改大量代码来兼容本土计算架构。与发展多年的成熟主流开源框架和CUDA生态相比重构的国产软件栈要在性能和稳定性上接近主流解决方案难度相当大。

但如果DeepSeek能与国产硬件厂商持续配合像研发大模型一样从零开始一步步前行才有可能彻底解下头顶那柄达摩克里斯之剑。

在持续改进大模型训练和推理效率方向上DeepSeek仍在探索并取得瞩目成绩。

今年7月底由DeepSeek团队和北京大学等机构发表梁文锋作为通讯作者的论文《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》获ACL 2025最佳论文奖。

GPT-5发布:产品化之路与国产大模型的“自给自足”挑战 GPT-5 产品化 国产大模型 自给自足 第3张

https://arxiv.org/abs/2502.11089

这篇论文首次将稀疏注意力从理论推理带入完整训练流程在保持模型性能提高训练效率的同时还带来高达 11 倍的推理加速。在自然语言处理顶会ACL上获得最佳论文奖足以说明业界对这项技术含金量的认可。

愿意将这样关键的创新公开也体现了DeepSeek不断推进大模型技术普惠的决心和能力。

让我们拭目以待融合了更多像“原生稀疏注意力”这样的DeepSeek新模型将在能力和效率上给业界带来多大惊喜又能将大模型研发的国产化程度推动到哪里。