作者|周鑫雨
编辑|苏建勋
在2025年的12月,如果你搭乘一架飞往美国的飞机,你很可能会遇到两群截然不同却又同样热情洋溢的旅客。
一群是热衷于深度学习、注意力机制的博士、大厂高管及投资人,他们的目的地是圣地亚哥的NeurIPS大会,这是AI研究界的“奥斯卡”,汇聚着未来最有价值的AI研究和人才。
另一群,则代表了AI技术的实际应用。他们手握名片,是AI创业者及合作客户,涌入拉斯维加斯,参加亚马逊云科技的年度盛会re:Invent,寻找AI技术的确定性机会。
在这场盛会上,一个明显的共识浮现:Agent的时代已经到来。与re:Invent上的十多名在美开发者交流后,我们发现了这一共识。
亚马逊云科技CEO Matt Garman在演讲中宣布了12项关于AI的新发布,所有内容都围绕着Agent的基础设施、开发和管理。他断言,AI Agent的出现正在让AI的价值得到真正的释放。
一名在美的亚马逊云科技工程师感受到了明显的变化。去年12月的re:Invent,全场标语充斥着AI Cloud、Model as a Service,而提到Agent的仅有寥寥几家。
但今年不同了。他开玩笑说:“如果你和全场每一个宣称要做Agent的展商干杯,即便他们没有真的在做,走一半你就醉了。”
△会场中的Agent讨论
△会场中的Agent讨论
然而,与这股“Agent热潮”形成鲜明对比的是,大多数美国开发者内心的冷静。
“我要来‘泼冷水’了。”硅谷数据库服务商PingCAP联合创始人兼CTO黄东旭坦言,无论从成本还是AI-first的能力来看,目前Agent的基础设施还很薄弱。
上述的亚马逊云科技工程师也有类似看法。“Agent发展的速度是破坏性的。”他提到,当厂商们都看到Agent相较于人类千万倍的开发效率时,对Agent开发的需求也呈指数级增长。
这对训练、推理的算力以及数据存储的软硬件都带来了巨大挑战。他提到,“现在,行业已经逐渐从GPU短缺演变为内存短缺。”
在推理成本的巨大压力下,Develop for Cost(为降低成本做开发)在美国Agent创业圈中成为了一种新的竞争力评价体系。
受制于模型推理能力,想要完成复杂任务或长文本处理,Agent往往需要调用“Pro”级别的模型——这也导致了高昂的调用消耗。
Pokee.AI创始人兼CEO朱哲清曾公开表示,市面上AI Agent的成本,平均百分之八九十都在推理上。他提到,如果AI应用公司能将推理成本降低80%,才能取得真正的利润。
“现在VC普遍会问Agent初创公司的一个问题是:推理成本多少?订阅能否cover推理成本?”re:Invent上,一名美国Agent创业者告诉我们。
此外,开发者们对Agent的另一个关键疑问是:市面上的软件做好了被Agent调用的准备了吗?
“目前的软件生态是为人开发的,而不是为AI Agent开发的。”Anthropic一名Code产品经理告诉我们。
作为数据库行业老兵,黄东旭有相同的观点,“人和AI对软件的使用偏好是不同的”。
比如,AI讨厌需要浪费更多Token去打通的数据孤岛以及在面对众多调用接口时容易因为注意力分散而出现幻觉、智力下降等“失控场面”。
黄东旭判断,厂商们需要围绕“给Agent使用”的理念开展一场软件革命:
不过,“给Agent泼冷水”也意味着作为Agent基础设施的模型层、Infra层、数据层厂商还有不少的迭代优化空间以及商业机会。
新的AI基建投资热潮正在席卷硅谷。通过优化AI Infra降低模型调用过程中的推理成本正在成为Infra创业的新风向。
例如,2025年9月,英伟达被曝豪掷超9亿美元拿下了AI Infra初创公司Enfabrica的技术授权并雇佣了CEO。一名数据库展商告诉《智能涌现》,自己近期正在计划投资几个在美华人的AI Infra项目。
另一个Agent的基建——数据也正受到重视。在re:Invent展会上Snowflake、MongoDB、Databricks等数据库厂商们占据了半壁江山。一名Snowflake的员工告诉我们数据决定了Agent对业务和场景的理解。
因此数据库厂商的新命题一是寻找能和Agent更为有效交互的数据库形态二是扩容做好承接爆发式的Agent开发需求的准备。
△Agent的基建热潮
欢迎交流!
本文由主机测评网于2026-05-24发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546063.html