当前位置:首页 > 科技资讯 > 正文

2025 AI新纪元:从模型竞赛到Agent部署的变革

2025年的大模型产业正在经历一场静默的分化。一方面,明星模型的参数竞赛如火如荼;另一方面,一场根本性的转变在基础设施层面悄然发生。

AI的价值实现路径,正逐渐从“模型能力展示”转向“Agent实际部署”。

亚马逊云科技CEO马特·加曼(Matt Garman)在2025 re:Invent主题演讲中直言:“Agent的出现,标志着我们在AI轨迹上发生了变化——从追求技术奇迹,转向真正获得价值的时代。”

他提供了一组反差强烈的数据:生成式AI全球狂欢,Amazon Bedrock已服务超过10万家企业,其中50多家客户处理了超1万亿tokens;然而,许多企业仍未看到AI投资带来的业务回报。

2025 AI新纪元:从模型竞赛到Agent部署的变革 Agent部署 AI工厂 模型生态 数据融合 第1张

Agent是企业从AI投资中获得实质性商业回报的关键。”Garman揭示了一个关键转折点,“未来,每个公司内部和每个领域都将有数十亿的Agent。”

一场重新定义AI价值实现的竞赛已经打响。在亚马逊云科技2025 re:Invent的舞台上,AI芯片性能飙涨600%,构建AI Agent的四大技术支柱同步升级,Agent部署的全栈战争已经升级……

2025 AI新纪元:从模型竞赛到Agent部署的变革 Agent部署 AI工厂 模型生态 数据融合 第2张

01.重新定义AI Infra:自研芯片与「AI工厂」的双重革命

算力竞争已进入云巨头自主可控、性能狂飙的阶段。亚马逊云科技在2025 re:Invent上展示了其尖端武器:基于自研3nm芯片的Amazon EC2 Trainium 3 UltraServers服务器全面推出,而下一代Trainium 4芯片性能令人震撼。

“今天Amazon Bedrock上的所有推理,大多由Trainium驱动。”Garman透露。亚马逊已部署超过100万颗自研Trainium芯片,且Trainium 2的量产速度是前代芯片的4倍

2025 AI新纪元:从模型竞赛到Agent部署的变革 Agent部署 AI工厂 模型生态 数据融合 第3张

最新性能数据显示:基于首款云端3nm AI芯片Trainium 3,Amazon EC2 Trainium 3 UltraServers服务器提供极致配置,将144颗Trainium 3芯片互连,提供362PFLOPS(FP8)算力和超过700TB/秒的总带宽。

与Trainium 2相比,该服务器提供4.4倍的计算性能、3.9倍的内存带宽提升,能效比也提升了5倍

而芯片性能只是变革的一半。亚马逊云科技同时推出了更具战略意义的Amazon AI Factories(AI工厂)服务——允许企业在自己的数据中心部署专用AI基础设施,同时享受亚马逊云科技的全套服务和管理。

02.模型生态的多元主义:自研模型超GPT-5.1,中国模型占1/4席位

与追逐“万能模型”的潮流相反,亚马逊云科技选择了多元化的模型战略。“我们从不相信会有一个模型统治一切。”Garman明确表示,“相反,会出现很多伟大的模型。”

2025 AI新纪元:从模型竞赛到Agent部署的变革 Agent部署 AI工厂 模型生态 数据融合 第4张

对中国企业而言,这意味着在出海和全球化过程中,可以获得更贴近本土技术特点的生成式AI支持。对全球用户而言,这代表了更广泛的技术选择。

03.数据与模型深度融合:开放训练模型打破“RAG局限”

“你的数据是独一无二的。”Garman强调。然而,传统数据与模型结合技术如RAG(检索增强生成)无法让模型真正“理解”企业的深层次领域知识。亚马逊云科技的革命性解决方案是:Amazon Nova Forge服务

2025 AI新纪元:从模型竞赛到Agent部署的变革 Agent部署 AI工厂 模型生态 数据融合 第5张

通过这项服务,企业可以在模型训练的任意阶段,将自己的数据与亚马逊训练数据集混合,创建定制模型。这一方法解决了传统微调中的核心矛盾——在教授新领域知识的同时避免遗忘已掌握的核心推理能力。

04.回归一件事:没有魔法,只有可部署的Agent

2025 AI新纪元:从模型竞赛到Agent部署的变革 Agent部署 AI工厂 模型生态 数据融合 第6张三类前沿Agent展示了AI重塑软件开发和运营的潜力。