今年的硅谷AI界,如夏日炎炎般热闹非凡。在5日晚上,一场AI界的诸神之战正式拉开帷幕——OpenAI在GPT-2之后,终于再次拥抱开源,发布了一个“号称”最强的开源推理大模型gpt-oss.
与此同时,谷歌也不甘示弱,推出了“开天辟地”式的大杀器——Genie 3。它能够用一句话生成一个长达数分钟的可交互三维虚拟世界,效果震撼。
而OpenAI的老对手Anthropic,也不认AGI只关注AI编程。它更新了自己最顶级的大模型:Claude Opus 4.1,将AI编程能力的上限再次提升。
尽管这三个新产品的发布都相当重要,但这只是未来几天硅谷AI圈“神仙打架”的序幕,更多好戏还在后头。
像以往一样,国人依然是这些团队的中流砥柱。硅谷的吃瓜群众也期待来自东方的DeepSeek和Qwen。希望国内的AI力量不会缺席这场夏末的AI盛宴。
时隔六年,OpenAI终于推出“开放权重”大语言模型:gpt-oss-120b和gpt-oss-20b。这两个模型都采用了Transformer架构,并融入了MoE设计。其中,gpt-oss-120b总参数达1170亿,激活参数为51亿;而gpt-oss-20b总参数为210亿,每token激活参数为36亿。
模型采用了分组多查询注意力机制,组大小为8,以及旋转位置编码(RoPE),原生支持128k上下文。
从性能上看,OpenAI官方表示这两个模型在相同体量下是开源推理模型的SOTA。
在核心推理基准测试中,gpt-oss-120b模型实现了与OpenAI o4-mini接近的性能,可在单张80 GB GPU上高效运行;而gpt-oss-20b在常见基准测试中能达到与OpenAI o3-mini类似的性能,可在仅具有16 GB内存的端侧运行。
尽管这两个模型都针对本地部署需求和市场推出,但在许可证中依然有限制,不允许年收入高于1亿美元或日活超过100万的实体商用。
发布后,网友们也迫不及待地进行了本地化部署,性能反馈不错。
在RTX 5090上运行20B版本,每秒能达到160-180 tokens的输出速度。
本文由主机测评网于2026-04-20发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260439039.html