当前位置：首页 > 科技资讯 > 正文

OpenAI携开源大模型搅局，国内AI格局待变

主机测评网
科技资讯
2026-04-20
373

OpenAI携开源大模型搅局，国内AI格局待变 OpenAI 开源大模型国内AI格局技术升级第1张

8月6日凌晨，OpenAI发布了两款开源大语言模型gpt-oss-120b和gpt-oss-20b。这是自2019年开源GPT-2以来，OpenAI首次发布开源模型，全球人工智能领域迎来重磅炸弹。

时隔六年再推开源大语言模型，OpenAI此举无疑向全球释放了技术普惠的信号。此举也令国内大模型竞争格局面临新的变数。

01 回归之作：技术的又一次飞跃?

据官方介绍，这两款模型均为纯文本语言模型，在文本处理、代码生成、数学问题求解等领域表现卓越。gpt-oss-120b总参数量为1170亿，激活参数为51亿，能够在单个80GB的GPU上运行，专为生产环境、通用应用和高推理需求的用例设计，既可以部署在数据中心，也能在高端台式机和笔记本电脑上运行。

而gpt-oss-20b总参数量为210亿，激活参数为36亿，专门针对更低延迟、本地化或专业化使用场景优化，在16GB的GPU上就能运行，这意味着大多数现代台式机和笔记本电脑都能驾驭。

二者均采用了Transformer架构，并融入专家混合（MoE）设计，减少处理输入时激活参数量，提升推理与内存效率。它们还借鉴了GPT-3的设计理念，采用交替的密集注意力和局部带状稀疏注意力模式，使用分组多查询注意力机制以及旋转位置编码，原生支持128k上下文。

训练数据聚焦于STEM、编程和通用知识领域，并使用o200k_harmony分词器进行数据分词，该分词器是OpenAI o4-mini和GPT-4o所用分词器的“超集”，也于此次同步开源。

除了性能强劲，OpenAI为这两款模型赋予了诸多实用特性。宽松的Apache 2.0许可证，开发者可自由用于构建，无copyleft限制或专利风险。任何消费者、开发者或企业可免费下载模型，进行参数级微调以适配特定用例，并用于商业服务或创收，无需向OpenAI支付费用。

模型具备可配置的推理强度，能依据用户具体用例和延迟需求调整推理投入程度。同时支持完整的思维链，可完整访问模型的推理过程，便于开发者调试并提升输出结果的可信度。另外，模型具备智能体能力，可利用原生的函数调用、网页浏览、Python代码执行和结构化输出等功能。

值得一提的是，这次开源并不彻底，这两款模型属于开放权重（open-weight）大语言模型，不提供训练数据和完整训练代码。但本地运行的支持使得这些模型无需连接网络，数据也不必上传到云端，满足受严格监管行业对数据隐私的要求。

02 格局变动：国内大模型迎挑战

在OpenAI开源之前，国内的大模型开源早已进行得如火如荼。

近几个月来，腾讯、智谱AI、昆仑万维等头部企业密集发布新一代开源大模型。

百度文心早在6月开源ERNIE-4.5系列；腾讯混元则在8月4日宣布开源四款轻量级模型；阿里巴巴的通义千问（Qwen）系列也在持续迭代；智谱AI在8月3日开源GLM-4.5及轻量版GLM-4.5-Air。

除传统巨头外，垂直领域企业表现也相当活跃。

昆仑万维开源多模态模型Skywork-R1V3-38B与轻量图文生成模型Skywork-UniPic-1.5B；字节跳动发布多语言翻译模型Seed-X-Instruct-7B与通用多模态模型Tar-7B；月之暗面推出数学证明专精模型Kimina-Prover-72B。

据Hugging Face中国社区统计，7月单月16家机构共开源31个模型及工具。

如今，OpenAI携两款开源模型强势入局，无疑为国内大模型开源竞争格局带来巨变。其开源行为为国内企业提供了学习借鉴先进技术的契机。然而，挑战也随之而来。国内企业如何充分发挥本地化优势成为亟待解决的课题。

这场全球性的大模型开源竞赛才刚刚开始。

云服务器阿里云服务器性价比服务器

本文由主机测评网于2026-04-20发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260439007.html

OpenAI携开源大模型搅局，国内AI格局待变

01

回归之作：技术的又一次飞跃?

02

格局变动：国内大模型迎挑战

英伟达Triton服务器漏洞：安全警钟再响

A股减持潮：结构优化与正常回归

OpenAI携开源大模型搅局，国内AI格局待变

01

回归之作：技术的又一次飞跃?

02

格局变动：国内大模型迎挑战

英伟达Triton服务器漏洞：安全警钟再响

A股减持潮：结构优化与正常回归

相关文章