当前位置:首页 > 科技资讯 > 正文

腾讯加强自研大模型:引入OpenAI前研究员姚顺雨,调整架构加速追赶

拥有领先大模型的科技公司实际上正在定义AI能力上限、技术模式与评估标准,其他企业只能跟随和适配,丧失产业定义权与路线主导权

在业界看来,腾讯在大模型研发节奏上稍逊于阿里与字节跳动。国际主流的大模型标准测试中,腾讯混元系列语言模型长期未能跻身第一梯队。腾讯系应用采用混元和DeepSeek并存的策略,用户可自行选择。这被视为因自研模型能力暂未领先而采取的妥协方案。

然而,腾讯正积极扭转这一态势,决心强化自研模型实力。

12月17日,腾讯宣布调整大模型研发组织架构,任命Vincesyao为“CEO/总裁办公室”首席AI科学家,直接向总裁刘炽平汇报。此举表明大模型研发已成为公司最高管理层聚焦的核心项目。

据《财经》获悉,Vincesyao本名姚顺雨,曾是OpenAI研究员。他1998年出生,本科毕业于清华大学姚班,后在普林斯顿大学获得博士学位。2024年8月加入OpenAI,参与开发Operator和Deep Research两款智能体产品,其学术研究为OpenAI的智能体业务奠定了重要基础。

早在今年9月,便有传闻称姚顺雨以高薪加盟腾讯,但腾讯始终未予证实。本次架构调整是姚顺雨首次在腾讯公开信息中亮相。

腾讯向《财经》确认,Vincesyao同时兼任新成立的AI Infra部及大语言模型部负责人,并向技术工程事业群总裁卢山汇报。

AI Infra部将承担大模型训练与推理平台的技术能力构建,AI Data部与数据计算平台部则负责大模型数据及评测体系搭建,以及大数据和机器学习的数据智能融合平台发展。

腾讯加强自研大模型:引入OpenAI前研究员姚顺雨,调整架构加速追赶 腾讯 大模型 姚顺雨 AI战略 第1张

姚顺雨的个人学术主页

腾讯为何会慢一步?

过去两年间,腾讯在大模型研发步伐上确实慢于阿里和字节跳动。2023至2024年,阿里通义实验室、字节跳动Seed实验室密集推出新模型,并在全球大模型标准测试榜单上持续领先。

腾讯混元系列语言模型长期与第一梯队存在距离。加州大学伯克利分校LMArena平台持续进行全球模型测试并发布Chatbot Arena排行榜,混元TurboS今年5月曾短暂升至第8位,但截至12月17日,混元T1-20250711综合排名滑落至第68名。

依托游戏业务积累,腾讯在3D/4D/世界模型方面具备优势,未来在机器人空间训练等领域潜力可观,但并非当前商业化变现最快或通用性最强的路径。截至12月17日,斯坦福大学WorldScore Leaderboard榜单中,腾讯混元World-Voyager位列全球第二。

多位腾讯内部人士(包括腾讯云等业务部门)曾向《财经》流露焦虑:腾讯与阿里、字节同属第一梯队,却未能研发出与自身地位相称的大型语言模型。他们认为,腾讯年净利润远高于阿里,理应投入更多利润到大模型训练等AI前沿领域。

缺乏强大自研模型,腾讯云等To B业务在与阿里云、火山引擎竞争时显得抓手不足。

腾讯加强自研大模型:引入OpenAI前研究员姚顺雨,调整架构加速追赶 腾讯 大模型 姚顺雨 AI战略 第2张

前述腾讯云人士指出,腾讯为保障股东利益每年进行大规模股票回购,股价长期稳定,成为投资者保值增值的稀缺标的。但他认为,“一家科技公司应有更大的梦想”,若将部分回购资金转投模型研发与算力建设,虽伴随风险,但能孕育更大可能性。

因大股东南非Naspers旗下Prosus持续减持,腾讯长期通过股票回购稳定股价。2024年回购总额达1120亿港元(约1014亿元人民币),并全部注销,有效提升每股收益,回报股东。2025年腾讯仍保持多轮回购。

是否全力投入大模型?腾讯内部意见不一。今年9月,一位内部人士对《财经》表示,社交与内容是腾讯根基,2023年以来未见能撼动这一根基的AI产品,因此腾讯并未仓促出击。

他补充说,这并非不重视AI,腾讯始终密切关注大模型,只是选择了更稳健的策略——将AI嵌入社交、广告、游戏等业务,既优化体验又提升变现效率。

为实现上述目标,腾讯仍投入了大量资本,是国内投资规模最大的企业之一。

腾讯财报显示,2024年Q3至2025年Q2,资本支出总额达1023亿元,同比增长178%。据《财经》多方了解,同期资本支出超千亿的国内科技公司仅腾讯、阿里、字节三家。

但腾讯采购的AI算力优先用于内部应用孵化和改造,微信、QQ生态(小程序、支付、广告)、企业微信、腾讯会议、腾讯文档、游戏以及元宝、ima等产品均融入AI功能。由于服务超十亿用户,业务日活往往过亿,如微信搜索日活已超1亿。

巴克莱银行2025年11月报告指出,腾讯AI投资保持理性,资本开支增长但注重ROI,未激进投入,与部分同行形成对比。

腾讯加强自研大模型:引入OpenAI前研究员姚顺雨,调整架构加速追赶 腾讯 大模型 姚顺雨 AI战略 第3张

一位资深算法工程师与一位腾讯云人士认为,腾讯以股东友好著称,优先确保股东回报,而非不计成本地投入模型研发与算力采购。

他们表示,游戏、广告、金融是腾讯主要现金流来源,具备轻资产、高回报特征。而大模型业务需重研发、重资产投入,回报周期不明。腾讯管理层素来稳健,面对此类高不确定性业务会较为谨慎。

“大模型竞争无休无止,今年领先明年不投入就会落后,需要长期算力与人才投入,可谓无底洞。但大模型也是5-10年的长跑,过去两年行业方向未明时,跟随第一梯队并非错误,反而可能是更经济的策略。”该算法工程师认为,待腾讯思路清晰后再加码亦不迟。

要做好大模型,先找人

据《财经》了解,除任命姚顺雨为首席AI科学家外,腾讯近期在国内积极招募年轻算法人才,甚至提供双倍薪资,旨在打造一支年轻活力的模型训练团队。

大模型研发通常需要顶尖科学家领军,并配备一批顶级算法人才。国内各公司模型训练团队规模多在100-200人,成员多毕业于清华、北大、浙大及海外名校计算机系,不乏奥赛金银牌得主。

创业公司月之暗面模型训练团队仅百余人,DeepSeek团队约200人。字节跳动Seed实验室为管理AI科学家,内部划分多个研究方向实验室,如大语言模型、视频模型等。

一位国内大模型创业公司人士透露,最核心的预训练团队甚至仅数十人,AI科学家普遍年轻,90后、95后成为中坚。如阿里通义千问核心负责人林俊旸年仅32岁。

一位算法工程师指出,年轻工程师不受旧知识体系束缚,从最新范式起步,能以前沿视角创新。大模型领域知识迭代按月甚至按周计算,一篇论文或一个模型即可颠覆原有路线。

吸引和管理这些年轻天才不能采用流水线模式,需营造自由开放的探索氛围。

一位带领60余名算法工程师的创业公司负责人12月对《财经》表示,算法训练无法流程化,充满不确定性,不可控且难以追责,如同化学实验,结果无法仅凭表面数据判断,需负责人亲自参与并理解每个算法。

自有大模型决定未来话语权

对腾讯等科技巨头而言,强化自研模型的现实意义不仅在于争夺流量,更在于保障利润。

2025年末,中国科技巨头纷纷利用自研模型推出AI To C应用,抢占AI新流量入口。

截至2025年9月,字节豆包App月活达1.72亿。10月后,阿里举全集团之力推广千问App,蚂蚁金服则全力投入灵光App。一位蚂蚁人士11月对《财经》称,先不计成本抢占流量入口,之后再谋后续。

腾讯“元宝”是被寄予厚望的AI To C产品。Questmobile数据显示,截至6月元宝月活3286万,位列国内AI对话App第三,仅次于豆包和DeepSeek。

目前腾讯社交、内容根基稳固,豆包、DeepSeek尚难构成威胁。但若AI对话应用渗透率持续上升并改变用户习惯,腾讯可能面临用户迁移、流量入口失守的风险,进而影响广告与游戏分发权。

此外,自研模型不强可能被模型强势方侵蚀利润。

12月,字节火山引擎一位算法负责人在小范围交流中预测,2030年豆包大模型Token调用量较2025年末将增长约100倍,AI应用将随之爆发。亚马逊AWS人士12月初则称,AI应用爆发时,自研模型薄弱的企业利润将直接受压。

对腾讯而言同理。若拥有自研强模型,每次API调用、微信AI对话的利润均留存于体系内;若依赖外部模型,随Token消耗指数级增长,微信、QQ等庞大生态将不得不为外部模型支付巨额推理算力,直接压缩毛利。

利润核心环节被“抽税”及成本失控风险是短中期挑战。长期来看,若无强大自研模型,科技巨头将在更多领域竞争中陷入被动。

当前,拥有顶尖大模型的科技公司正定义AI能力上限、技术范式与评价标准,其他企业只能跟随适配,丧失产业定义权与路线主导权。

而这绝非腾讯所愿。