当前位置：首页 > 科技资讯 > 正文

GLM-5即将发布：Pony Alpha或成测试版，开源代码泄露参数架构

无论Pony Alpha是否属于智谱，下一代旗舰大模型GLM-5都即将登场。

GitHub代码库已确认，新一代架构细节也浮出水面。

GLM-5即将发布：Pony Alpha或成测试版，开源代码泄露参数架构 GLM-5 Pony Alpha DeepSeek 开源代码第1张

GLM-5采用了DeepSeek-V3/V3.2架构，包括稀疏注意力机制（DSA）和多Token预测（MTP），总参数量达到745B，是上一代GLM-4.7的两倍。

GLM-5即将发布：Pony Alpha或成测试版，开源代码泄露参数架构 GLM-5 Pony Alpha DeepSeek 开源代码第2张

与此同时，OpenRouter平台上突然出现的神秘匿名模型「Pony Alpha」，其编程和推理能力极为强大，被社区超过91%的用户判断为GLM-5的测试版。

受这些消息影响，智谱AI港股在两天内暴涨60%。

GLM-5即将发布：Pony Alpha或成测试版，开源代码泄露参数架构 GLM-5 Pony Alpha DeepSeek 开源代码第3张

开源代码泄露其参数架构

GLM-5的架构信息并非来自智谱官方，而是被开源社区从代码提交中“挖”出来的。

在vLLM推理框架的PR中，开发者发现GLM-5的实现逻辑被直接映射到了DeepSeek-V3的组件上。

GLM-5即将发布：Pony Alpha或成测试版，开源代码泄露参数架构 GLM-5 Pony Alpha DeepSeek 开源代码第4张

GLM-5继承的第一项核心技术是DeepSeek稀疏注意力（DeepSeek Sparse Attention，DSA）。

DSA通过两阶段流程大幅提升了长文本处理效率，且输出质量几乎不受影响。

首先由Lightning Indexer轻量级组件快速扫描所有历史token并打分，评估它们与当前query token的相关性；然后只挑选得分最高的Top-k个token进行完整的注意力计算，其余全部跳过。

第二项技术是多Token预测（Multi-Token Prediction，MTP），用于提升模型的生成效率。

从代码中推断出的架构参数显示，GLM-5包含78层隐藏层，采用MoE（混合专家）架构，共256个专家，每次推理激活8个，激活参数约44B，稀疏度5.9%，与DeepSeek-V3.2的5.4%基本持平。

上下文窗口支持最高202K token。

GLM-5即将发布：Pony Alpha或成测试版，开源代码泄露参数架构 GLM-5 Pony Alpha DeepSeek 开源代码第5张

有开发者指出，复用DeepSeek架构意味着GLM-5可以直接受益于vLLM、SGLang等推理框架已有的优化，部署门槛会更低。

但也有人提出疑问：DeepSeek-V3架构以纯文本为主，GLM-5首发版本是否会因此缺失多模态能力？

GLM-5即将发布：Pony Alpha或成测试版，开源代码泄露参数架构 GLM-5 Pony Alpha DeepSeek 开源代码第6张

2月初，OpenRouter平台上新出现的匿名免费模型，代号「Pony Alpha」，支持200K上下文窗口。

GLM-5即将发布：Pony Alpha或成测试版，开源代码泄露参数架构 GLM-5 Pony Alpha DeepSeek 开源代码第7张

模型一上线就引起了开发者社区的广泛关注，它的编程能力非常突出，能根据单条提示直接生成完整的功能性应用程序，在复杂推理和Agent工作流上同样表现出色。

“这到底是谁家的模型”迅速成为社区热议话题。

GLM-5即将发布：Pony Alpha或成测试版，开源代码泄露参数架构 GLM-5 Pony Alpha DeepSeek 开源代码第8张

指向GLM-5的证据链覆盖了多个维度：

时间上，「Pony Alpha」出现的节点与智谱首席科学家唐杰多次暗示的GLM-5发布窗口完全吻合。

GLM-5即将发布：Pony Alpha或成测试版，开源代码泄露参数架构 GLM-5 Pony Alpha DeepSeek 开源代码第9张

本文由主机测评网于2026-04-11发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260435857.html