2025年9月19日,亚马逊云科技官方宣布,Qwen3和DeepSeek v3.1首次在Amazon Bedrock平台上架,正式向全球用户提供服务。这一消息迅速引起了生成式AI市场对Amazon Bedrock的再度关注。
DeepSeek v3.1的部分测试成绩展示,图片来源于DeepSeek官方文档。
Qwen3-235B系列的测试成绩,图片来自通义千问微信公众号。
Amazon Bedrock最初以“大模型货架”的形式呈现给客户,其核心哲学是“Choice Matters”(选择至关重要),旨在为多样化的业务需求提供最合适的基础模型。因此,自推出以来,主流模型迅速上架Amazon Bedrock,可供客户选择,模型数量超过200款,是市场竞争对手的两倍以上。
“Choice Matters”理念的提出,基于一个关键洞察:不存在一个在所有场景下性能和性价比都最优的通用模型。回顾2025年基础模型厂商的竞争动态以及不同地区服务政策的变化,这一理念的现实意义更加凸显。
从这个角度看,亚马逊云科技始终坚持的“Choice Matters”已经是一个相对保守的说法——如果企业在模型选择上缺乏灵活性和多样性,其AI战略可能会陷入被动。
2023年,亚马逊云科技首次提出“Choice Matters”理念,但当时行业并未完全认同。尽管逻辑上可行,情感上仍存疑虑。这主要是由于两个技术推论混淆了行业认知。
首先,从资本角度,普遍认为大模型训练成本极高,需要万卡集群作为入场券,闭源模型主导市场,开源模型有限,“百模大战”将演变为少数巨头的竞争,选择余地不大。
其次,从技术角度,认为大语言模型在数据和架构上的进化空间有限。高质量数据稀缺,难以催生新的“智能涌现”;Transformer架构仍是主流,短期内无更好替代方案。因此,大模型的“技术天花板”即将触顶,厂商重点将从基础模型转向垂直行业解决方案。
这两个推论的影响深远。一些知名投资人和云计算公司信奉第一个推论,而如百川智能等公司则深信第二个推论,过早放弃基础模型探索,错过了AI Agent的发展机遇。
实际上,技术突破并非短期行为,大模型的技术曲线依然陡峭,市场选择丰富多样。依赖单一模型构建的AI能力,很容易被新模型突破所颠覆,这在定制化To B AI解决方案中尤为常见。
2025年1月之前,基于开源模型交付的定制化AI解决方案,因DeepSeek的发布而变得过时。随后,Qwen3、Kimi K2和DeepSeek v3.1的陆续发布,又使部分方案再次被淘汰——半年内三次更新,生动揭示了“单一模型解决方案”的局限性。
此外,2025年音视频模型技术快速演进,AI短剧成为“蓝海市场”,未来规模可能达千亿级。对新成立的工作室而言,如何选择和构建工具成为核心问题。
无疑,无论是企业服务、AI短剧还是推动AI落地的公司,都需要能够应对行业波动、灵活多元的MaaS基础设施。
经过两年持续投入,Amazon Bedrock几乎成为唯一选择。
除了惊人的模型数量和更新速度,Amazon Bedrock还能为特定行业和场景提供差异化模型建议。
例如,媒体广告行业可选用Marengo、Pagsus、Stable Diffusion;金融行业适合Palmyra x5;重推理场景推荐DeepSeek v3.1;文本摘要则可用Mixtral。与试图用DeepSeek解决所有问题的方案相比,这种针对性的选择更可靠。以Palmyra x5为例,其100万Token的上下文窗口,比一般推理模型高一个数量级,更适合财务报告和法律合同分析。
考虑到2025年中企出海趋势的高涨,“Choice Matters”策略的重要性进一步上升——在模型选型上,国内外存在不同模板和采购清单。但无论哪种模型,大多能在Amazon Bedrock中找到。这也是亚马逊云科技营收快速增长的原因之一。
2024年,亚马逊云科技全球营收突破千亿美元,“Choice Matters”策略的成功实施功不可没。
Palmyra x5的出现反映了大模型的发展趋势:从单一到多元,从通识到专业。当Agentic AI通过MCP、A2A协议调用不同智能体和模型进行精细分工时,“Choice Matters”策略必然成为未来Agent平台的内在逻辑。
专业能力和精细分工的本质在于模型设计思路和训练数据的差异。
以Palmyra x5为例。支持百万级Token上下文需要代价:上下文增长可能导致计算复杂度和内存占用呈平方级增加。而且,单纯增加上下文长度并不保证模型能有效利用所有信息。实际上,模型注意力呈“U型分布”,更关注开头和结尾,中间信息易被忽略,称为“中间迷失”现象。
对Palmyra x5而言,消除“中间迷失”现象成为技术团队的关键任务。
反观新上线的DeepSeek v3.1,它并非专为金融场景设计,而是更注重Agent能力和推理效率。从DeepSeek过去半年的落地情况看,维持全功能运行已需相当算力成本,盲目增加上下文窗口并无必要。
训练数据的选择也影响模型在不同场景的表现。
据悉,DeepSeek v3.1新增的840B Tokens中,代码和数学类数据占比提升,以增强逻辑推理和数学能力。
DeepSeek称其为“迈向Agentic AI时代的第一步”,因此推测它可能增加了大量Agentic数据。
Agentic数据是专门用于训练AI智能体的数据,包含行动轨迹、决策过程和环境交互信息。它超越传统对话数据,注重智能体在任务中的多步动作、工具使用、决策逻辑(包括错误和纠正)以及与环境的互动。
Qwen 3同样重视代码、数学和Agentic数据,并强调多语言能力——中文数据仅占45%,支持119种语言。在成本上,Qwen 3部署成本大幅降低,仅需4张H20即可部署全功能版本,显存占用仅为同类模型的三分之一。
总之,要确保AI成功落地并在各场景达到最佳效果,关键在于灵活选型和调用。亚马逊云科技数据和AI GTM副总裁Rahul Pathak在博客中精辟总结(翻译并略作编辑):
模型选择需考虑三点:
不同用例需要不同工具,不应期望一个模型以最佳方式解决所有业务问题。
在模型间实验和切换的能力不仅便利,更是竞争优势。能快速测试和部署不同模型的组织,总是优于那些固守单一模型的组织。
成本优化源于将正确模型匹配每项任务,避免过度设计或表现不足。
就“竞争优势”而言,Amazon Bedrock已将其转化为系统级能力。
Amazon Bedrock为模型评估提供两条路径:自动评估和人工评估。自动评估适用于客观指标,人工评估针对主观判断,后者还可借助亚马逊云科技的官方评估团队。两种方式均生成详细报告供决策参考。
Amazon Bedrock还提供精选公开数据集,覆盖问答、摘要等任务,并允许企业上传特定业务数据集,进一步提升模型测试和选型的实用价值。
如果说AI正在替代部分传统工作,那么传统咨询公司在2023年的主营业务——模型介绍、推荐与评估——已被Amazon Bedrock完全取代。这符合现代企业发展规律:将人员能力沉淀为系统能力,最终促进业务成长。
由此可见,以Amazon Bedrock为代表的“Choice Matters”策略,正深刻影响着AI落地行业的整体进程。
本文由主机测评网于2026-01-02发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260114149.html