在混元 2.0 发布仅两周后,腾讯大模型研发体系迎来了一次至关重要的「系统升级」。
大模型领域的竞争已深入核心地带,腾讯正通过调整战略布局,以应对日益激烈的挑战。
12 月 17 日,腾讯宣布对大模型研发架构进行升级。此次调整的核心在于成立了三个新部门:AI Infra 部、AI Data 部以及数据计算平台部。
这一调整标志着腾讯在混元大模型迈入 2.0 时代后,对研发体系进行的一次全面「加速」。
在人事安排上,技术型高管被置于更为核心的位置。Vincesyao 出任「CEO/总裁办公室」首席 AI 科学家,直接向腾讯总裁刘炽平汇报;同时,他还兼任新成立的 AI Infra 部及大语言模型部负责人,向技术工程事业群(TEG)总裁卢山汇报。
一手掌管算法(大语言模型部),一手抓算力基建(AI Infra 部),同时直通公司最高决策层,这一配置显示出:在腾讯的战略蓝图中,大模型的研究与工程实施正在实现深度整合。
据悉,Vinces Yao 正是数月前传闻加入腾讯的姚顺雨,他毕业于清华和普林斯顿大学,曾任 OpenAI 研究员。
据外媒报道,自今年 9 月从 OpenAI 离职并加入腾讯以来,姚顺雨获得了高层的充分授权,以推动内部文化与组织变革。过去几个月里,腾讯在大模型人才争夺战中一改往日守势,开始以双倍薪资从竞争对手如字节跳动处积极招募核心研究员,并为应届博士生提供比行业标准高出 50% 的薪资。
姚顺雨 10 月在 X 上发帖|图片来源:X
更深层次的变革在于「权力交接」。腾讯正在进行内部重组,降级那些虽擅长工程落地和广告算法但缺乏前沿 AI 研究背景的管理者,将指挥权真正交还给「研究派」。这一去肥增瘦的动作旨在打破过去「产品经理思维」主导大模型研发的局限。
姚顺雨出生于 1998 年,是人工智能领域的顶尖青年科学家。他本科毕业于清华大学计算机系(姚班),后赴普林斯顿大学攻读计算机科学博士学位。2024 年,他正式加入 OpenAI,专注于智能体(Agents)与深度研究(Deep Research)方向。
在 OpenAI 任职期间,他主要在以下领域取得了核心成果:
提升推理能力:提出了著名的思维树(Tree of Thoughts, ToT),通过让大模型进行多路径推理和反复思考,大幅提升了模型解决复杂问题的能力;
智能体研究:他是 SWE-bench(大模型代码能力评估数据集)和 SWE-agent(开源 AI 智能体)的关键贡献者,并参与了 ReAct(推理与行动结合)和 CoALA(智能体认知架构)等开创性工作。
此外,他还在个人社交平台上发布了关于「AI 下半场」的见解,主张 AI 发展的重心应从单纯的训练转向问题定义与评估。他认为在当前阶段,评估比训练更为重要。
在过去一年的「百模大战」中,行业逐渐达成共识:大模型的竞争已超越单纯的算法层面,成为算力、数据、工程化能力的综合较量。
此次腾讯成立 AI Infra 部,正是为了应对「算力效率」这一关键挑战。
据官方信息,AI Infra 部将作为腾讯大模型体系的关键一环,专注于大模型分布式训练、高性能推理服务等核心技术。其目标非常明确:构建大模型 AI Infra 的核心竞争力,为算法研发和业务场景落地提供稳定、高效的技术支撑。
这符合大模型技术演进的规律——随着模型参数量级的不断提升(如腾讯近期发布的混元 2.0),如何让庞大的 GPU 集群高效运转,以及在大规模并发下保证推理速度和成本,已成为决定胜负的「隐形战场」。
腾讯表示,在过往混元大模型的训练及海量业务实践中,公司已积累了系统化的工程能力。此次独立建制旨在进一步强化这一优势,提升 AI 大模型的整体研发效率。
除了算力基建外,数据质量和评测体系也被提到了新的高度。
此次升级中,新成立的 AI Data 部将由刘煜宏负责,专注于大模型数据及评测体系建设;而数据计算平台部则由陈鹏负责,聚焦大数据和机器学习的数据智能融合平台建设。两人均向公司副总裁蒋杰汇报。
这意味着数据处理不再只是算法研发中的附属流程,而是作为独立且关键的环节被标准化和制度化。
与此同时,王迪将继续担任大语言模型部副总经理,向姚顺雨汇报以确保模型算法团队与新成立的基础设施部门保持紧密协同。
过去两年尽管拥有微信这样的国民级应用腾讯在 AI 模型层却一度被外界视为「旁观者」。
一个标志性事件是今年 2 月腾讯元宝率先接入 DeepSeek R1。虽然这一动作让元宝的活跃用户数实现了数量级跃升但也给腾讯内部敲响了警钟:自有模型的缺位甚至导致内部部分业务团队因混元竞争力不足而犹豫是否接入。
这种焦虑最终转化为自上而下的压力。据报道腾讯总裁刘炽平今年早些时候曾对团队下达硬指标要求必须在技术水位上赶超对手。此次变革正是为了解决此前因组织分散导致的资源内耗集中力量为算法团队输送「弹药」。
架构调整的最终目的正是为了支撑产品和业务的快速奔跑。
在前不久的 12 月 5 日腾讯发布了混元 2.0在预训练数据和强化学习策略上进行了显著改进其 3D 模型甚至保持着全球领先水准在开源社区下载量突破 300 万。
在应用层腾讯元宝上线初期保持了「一天一版本」的迭代频率目前用户规模已稳居国内 AI 应用前三。而在腾讯内部一场静水流深的 AI 效率变革正在发生:超过 90% 的腾讯工程师正在使用腾讯云代码助手 CodeBuddy;50% 的新增代码由 AI 辅助生成;代码评审环节的 AI 参与度高达 94%。
目前腾讯混元大模型已在腾讯会议、微信、广告、游戏等内部超过 900 款应用和场景中落地。
近期混元团队的高密度人才引进与重组本质上正是为了支撑这种高强度的技术攻坚与业务渗透。通过成立 AI Infra 等新部门腾讯正在试图打通从底层算力、数据处理到上层算法、应用落地的各个环节为接下来的 AI 长期竞赛备好粮草。
本文由主机测评网于2026-05-29发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546556.html