竞争愈发激烈!这场AI大模型竞赛真是让人直呼过瘾!
权威AI大模型评测平台Chatbot Arena最新榜单已经出炉!
阿里Qwen3-235B-A22B-Instruct-2507在大型语言模型总榜上名列第三,而月之暗面Kimi-K2-0711-preview与深度求索DeepSeek-R1-0528则并驾齐驱,共同占据总榜第五的位置,它们以开源的姿态,成功超越了Claude 4、GPT-4.1等顶级非开源模型。
在多模态大模型领域,字节图像生成模型Seedream-3在文本生成图像榜单上位列第五,而字节图像编辑模型Seededit-3.0、字节开源统一多模态基础模型BAGEL以及阶跃星辰开源图像编辑模型Step1X-Edit则分别在图像编辑榜单上占据第五、第七和第八的位置。
在7月30日公布的Chatbot Arena编程榜单中,深度求索Deepseek-R1-0528与阿里Qwen3-Coder并列第一,而月之暗面Kimi-K2-Instruct则位列第七。
值得一提的是,阿里Qwen3-235B-A22B-Instruct-2507、阿里Qwen3-Coder、月之暗面Kimi K2均为7月最新发布的开源模型。
在7月的尾声和8月的开端,中国AI大模型依旧在紧锣密鼓地推出新品。字节跳动、阶跃星辰、阿里和月之暗面等公司在最近两天接连公布了新的模型动态。
在周四晚,字节跳动的Seed团队发布了实验性扩散语言模型Seed Diffusion Preview,而阶跃星辰则推出了开源基础大模型Step3。到了周五,阿里开源了“甜品级”编程模型Qwen3-Coder-30B-A3B-Instruct,月之暗面则发布了kimi-k2的高速版kimi-k2-turbo-preview。
Hugging Face在周五还发布了中国AI社区7月的重点回顾,回顾了这一个月来令人眼花缭乱的开源浪潮,其中包括:
✨ 又一个“DeepSeek时刻”——Kimi K2
✨ Qwen完全矩阵化:Instruct / Thinking / Coder模型跨越30B - 480B参数规模
✨ 多模态浪潮:
✨ 轻量级、可部署的模型
✨ Agentic编程成为主流
✨特定领域和实用的模型/工具/数据集
...(以下部分省略)...
本文由主机测评网于2026-04-19发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260438840.html