2025年的大模型产业正在经历一场静默的分化。一方面,明星模型的参数竞赛如火如荼;另一方面,一场根本性的转变在基础设施层面悄然发生。
AI的价值实现路径,正逐渐从“模型能力展示”转向“Agent实际部署”。
亚马逊云科技CEO马特·加曼(Matt Garman)在2025 re:Invent主题演讲中直言:“Agent的出现,标志着我们在AI轨迹上发生了变化——从追求技术奇迹,转向真正获得价值的时代。”
他提供了一组反差强烈的数据:生成式AI全球狂欢,Amazon Bedrock已服务超过10万家企业,其中50多家客户处理了超1万亿tokens;然而,许多企业仍未看到AI投资带来的业务回报。
“Agent是企业从AI投资中获得实质性商业回报的关键。”Garman揭示了一个关键转折点,“未来,每个公司内部和每个领域都将有数十亿的Agent。”
一场重新定义AI价值实现的竞赛已经打响。在亚马逊云科技2025 re:Invent的舞台上,AI芯片性能飙涨600%,构建AI Agent的四大技术支柱同步升级,Agent部署的全栈战争已经升级……
算力竞争已进入云巨头自主可控、性能狂飙的阶段。亚马逊云科技在2025 re:Invent上展示了其尖端武器:基于自研3nm芯片的Amazon EC2 Trainium 3 UltraServers服务器全面推出,而下一代Trainium 4芯片性能令人震撼。
“今天Amazon Bedrock上的所有推理,大多由Trainium驱动。”Garman透露。亚马逊已部署超过100万颗自研Trainium芯片,且Trainium 2的量产速度是前代芯片的4倍。
最新性能数据显示:基于首款云端3nm AI芯片Trainium 3,Amazon EC2 Trainium 3 UltraServers服务器提供极致配置,将144颗Trainium 3芯片互连,提供362PFLOPS(FP8)算力和超过700TB/秒的总带宽。
与Trainium 2相比,该服务器提供4.4倍的计算性能、3.9倍的内存带宽提升,能效比也提升了5倍。
而芯片性能只是变革的一半。亚马逊云科技同时推出了更具战略意义的Amazon AI Factories(AI工厂)服务——允许企业在自己的数据中心部署专用AI基础设施,同时享受亚马逊云科技的全套服务和管理。
与追逐“万能模型”的潮流相反,亚马逊云科技选择了多元化的模型战略。“我们从不相信会有一个模型统治一切。”Garman明确表示,“相反,会出现很多伟大的模型。”
对中国企业而言,这意味着在出海和全球化过程中,可以获得更贴近本土技术特点的生成式AI支持。对全球用户而言,这代表了更广泛的技术选择。
“你的数据是独一无二的。”Garman强调。然而,传统数据与模型结合技术如RAG(检索增强生成)无法让模型真正“理解”企业的深层次领域知识。亚马逊云科技的革命性解决方案是:Amazon Nova Forge服务。
通过这项服务,企业可以在模型训练的任意阶段,将自己的数据与亚马逊训练数据集混合,创建定制模型。这一方法解决了传统微调中的核心矛盾——在教授新领域知识的同时避免遗忘已掌握的核心推理能力。
三类前沿Agent展示了AI重塑软件开发和运营的潜力。
本文由主机测评网于2026-05-20发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260545586.html