作者|周鑫雨
编辑|苏建勋
2025年12月,若您搭乘航班前往美国,很可能会邂逅两类旅客:
一类是畅谈深度学习、注意力机制的博士、科技大厂高管和投资人。他们的目标是圣地亚哥,那里正举办AI研究界的“奥斯卡”NeurIPS(神经信息处理系统大会),众人押注于未来最具价值的AI研究与人才。
另一类则聚焦于AI落地的务实机遇。众多手持名片的AI创业者与合作伙伴涌入拉斯维加斯——参与亚马逊云科技年度盛会re:Invent,在这里寻觅AI领域的确定性机会。
至于这一确定性机遇——在与re:Invent现场的十余名美国开发者交流后,我们发现大洋两岸达成共识:Agent的时代已然降临。
亚马逊云科技CEO Matt Garman发布了12项AI相关更新,均围绕Agent的基础设施、开发与管理展开。他在演讲中断言:AI Agent的出现,正真正释放AI的价值潜力。
一位亚马逊云科技的美国工程师深切感受到行业水温之变。去年re:Invent全会场遍布“AI Cloud”、“Model as a Service”标语,提及Agent的厂商不足五家,如DataDog。
但今年景象迥异。“若您与每个宣称布局Agent的展商举杯,即便他们未必实质推进,”他戏言道,“走至半途,您便已沉醉。”
△展会现场一景
△展会现场另一视角
然而,与令人目眩的“Agent热”形成鲜明对比的,是弥漫于多数美国开发者间的理性冷静。
“我来‘泼点冷水’。无论从成本角度,还是AI优先的能力层面,当前Agent基础设施仍显薄弱。”扎根硅谷多年的数据库服务商PingCAP联合创始人兼CTO黄东旭向《智能涌现》坦言。
前述亚马逊云科技工程师持类似观点。“Agent发展速度具有颠覆性。”他指出,当企业目睹Agent相比人类千万倍的开发效率后,对Agent开发的需求呈指数级增长。
这对训练与推理的算力,以及数据(作为Agent训练资源)存储的软硬件均构成巨大挑战,“如今,行业已从GPU短缺逐步转向内存短缺。”他补充道。
在推理成本的重压之下,Develop for Cost(为降本而开发)已成为美国Agent创业圈新的竞争力标尺。
受限于模型推理能力,为处理复杂任务或长文本,Agent常需调用“Pro”级模型——这导致高昂的调用开销。
Pokee.AI创始人兼CEO朱哲清曾公开表示,市面AI Agent成本中,平均80%-90%源于推理。他强调,AI应用公司唯有将推理成本降低80%,才可能实现真实盈利。
“当前风投普遍会问Agent初创公司:推理成本多少?订阅收入能否覆盖推理成本?”re:Invent上,一位美国Agent创业者透露。
此外,开发者对Agent的另一核心质询是:现有软件生态是否已备好迎接Agent调用?
“当前软件生态为人而设计,而非为AI Agent打造。”Anthropic一位Code产品经理表示。
作为数据库领域资深人士,黄东旭持相同看法,“人与AI对软件的使用偏好存在差异”。
例如,AI厌恶需消耗额外Token打通的数椐孤岛;面对繁多调用接口时,AI易因注意力分散产生幻觉、智力下降等“失控”现象。
黄东旭判断,厂商需围绕“为Agent服务”理念掀起软件革命:首先,在软件交互界面,需让Agent以最简方式表达灵活需求,如为AI设计类似SQL的数据交互语言;其次,避免制造数据孤岛;第三,成本管控。
然而,“为Agent泼冷水”也意味着,作为Agent基础设施的模型层、Infra层与数据层厂商,仍具迭代优化空间与商业机遇。
新一轮AI基建投资热正席卷硅谷。通过优化AI Infra以降低模型调用中的推理成本,已成Infra创业新趋势。
例如,2025年9月,英伟达被曝以超9亿美元获AI Infra初创Enfabrica技术授权,并聘其CEO。一位数据库展商告知《智能涌现》,其正计划投资数个在美华人的AI Infra项目。
Agent的另一基建——数据,也日益受重视。re:Invent展会上,Snowflake、MongoDB、Databricks等数据库厂商占据半壁江山。一位Snowflake员工表示,数据决定了Agent对业务与场景的理解深度。
因此,数据库厂商的新议题,一是探索与Agent更高效交互的数据形态,二是扩容,以应对爆发式Agent开发需求。
△展会数据中心展示
“Agent目前并非泡沫。”Anthropic一名员工总结道,“但若人人追逐显性应用,却无人夯实匹配基建,泡沫便将滋生。”
△Anthropic展位听众云集。图源:作者拍摄
欢迎交流探讨!
本文由主机测评网于2026-02-07发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260223629.html