当前位置:首页 > 科技资讯 > 正文

中国AI崛起:从跟随到领跑

在聆听DeepMind CEO对中国AI的评述时,一句刺耳的话回响在耳边:中国AI毫无创新,仅仅依靠可怕的速度跟进。

这句话,是否让你感到熟悉?

过去几年里,这种叙事几乎成了西方对我们的固定思维,他们认为西方负责「从 0 到 1」的发明,而我们则负责「从 1 到 100」的内卷。

即使我们跑得再快,在他们眼中,我们充其量只是个「勤奋的跟随者」。

说实话,这种论调过去我们很难反驳。因为放眼国际主流榜单,几乎全是美国产品:OpenAI、Google、Anthropic。但偏见最怕硬数据。

今天(12月23日),全球公认最难刷榜、最讲究「盲测体验」的大模型竞技场LMArena更新了排名;在众多美国模型的重重包围里,百度文心ERNIE-5.0-Preview-1203脱颖而出,以1451分拿下国内第一。

这个分数意味着什么?

在国际舞台上,文心已成为国产AI的优秀代表,在LMArena排名前10,超过了Claude Sonnet4.5、GPT-5.2等前沿模型,是前20里唯一的非美国模型,打破了美国的垄断。

当唯一的中国名字出现在榜单前列,当我们的AI不再满足于「跟跑」时,中美AI的这盘棋,是否已悄然改变?

智远分析认为,赢得这场竞赛,不能靠运气,也不能全靠「堆显卡」。我仔细查阅了文心5.0 Preview背后的技术文档,发现百度在修炼几门极为精深的「内功」,这是它能突围的核心原因。

首先,最核心的是「原生」生命体的打造。

注意这个词:原生全模态(Native Omni-modal);以往很多所谓「多模态」模型是「拼凑」出来的,给大模型外挂一个看图的眼睛、外挂一个听声音的耳朵。

这种后期融合虽然能用,但各感官之间是割裂的;文心5.0不同。它采用了「原生全模态统一建模」技术。

打个比方:

它像一个天生具备视、听、说能力的生命体;从训练的第一天起,文本、图像、音频、视频就是融合在一起学习的。

因此,它能直接理解视频里的情绪,直接看懂图片里的逻辑。这种「出厂设置」级别的差异,让它的理解和生成能力直接跃升一个台阶。

中国AI崛起:从跟随到领跑 中国AI  创新 LMArena 百度文心 第1张

第二招,是「大块头」也有「大智慧」。

文心5.0参数量达到了惊人的2.4万亿。这是目前业界已公开参数模型中的「巨无霸」。

通常我们认为,模型越大越笨重、越烧钱;百度用了一种「超大规模混合专家模型(MoE)架构」,解决了这个悖论。

简单说,这2.4万亿参数像一个庞大的专家库。在处理具体问题时,只激活其中不到3%的相关专家来工作;在LMArena这种拼反应、拼逻辑的盲测里,这种架构优势非常明显。

第三招,是「思考」与「行动」的合体。

文心4.5开始就致力于「知行合一」,突破了仅基于思维链优化的范式。在思考路径中结合工具调用,构建了融合思考和行动的复合思维链,模型解决问题能力得到显著提升。

同时,结合多元统一的奖励机制,实现了长距离思维和行动链的端到端优化,显著提升了跨领域问题解决能力。

因此,不能简单将其归纳为弯道超车。

从「拼接」走向「原生」,从「堆参数」走向「MoE」,从「单点问答」走向「智能体思考」,这1451分的背后,是技术路线的质变。

当不再盲目堆算力,开始在架构、思考能力上找突破口时,打赢GPT-5.2也就不是什么不可思议的事了。

不可思议不是我随意能定论。毕竟,刷榜这事儿中国不爱干,干了也没用。能把技术用到应用中才是真本事。

DeepMind觉得中国AI缺乏创新,理由是我们太热衷于「应用」,但智远看来这是东西方视角的错位。

硅谷的创新往往在实验室的白板上追求算法「从 0 到 1」,而中国的创新则扎根在泥土里、车间里、代码行里追求产业的「从 1 到 100」。

我认为反驳「无创新论」最有力的武器是看能否解决美国AI从未遇到甚至想象不到的复杂难题。例如在大国重器中解决物理世界的硬伤。

来看看文心大模型在各行各业的应用:

中车集团你知道吗?就是造高铁的那个。

以前做高铁的气动外形设计是纯粹物理活儿更是苦力活儿。因为空气看不见摸不着设计师设计一个车头好不好用必须放进风洞实验室里吹。

跑一次数据涉及海量的流体力学计算可能要耗时好几个月而且风洞实验成本极高可以说是“烧钱又烧时间”。

现在一切都变了。

他们把文心大模型用在空气动力学仿真上。基于百度飞桨的科学计算能力大模型学习了海量的历史实验数据它已经“懂”了风的规律。

有了这个“外挂”过去几个月的实验周期现在最快几分钟就能算出结果。设计师有个新想法立刻就能跑出数据验证创新的迭代速度快了成百上千倍。

更科幻的是他们还搞了个“虚拟传感器”。

这又是什么黑科技呢?这么说吧高铁上有很多精密部件无法安装实体传感器(比如空间太小或者环境太恶劣)。

以前这些地方出了问题只能靠猜或者靠检修。但现在利用大模型强大的推演能力能凭现有的电流、电压等外围数据AI就能在虚拟世界里“推算”出核心部件的实时状态。

这好比给列车装了一双透视的“天眼”把故障检测的准确率硬生生在现有传感器检测的基础上再提升了10%;这10%关乎中国高铁的安全关乎亿万乘客的生命。

再比如国家电网。

以前巡检电塔那是工人拿命去爬风吹日晒。现在靠无人机+大模型一年巡检500万基杆塔人工登塔次数直接减少了40%。

这种把AI塞进高铁和电网里解决物理世界硬伤的能力DeepMind见过吗?