2025年9月19日,亚马逊云科技宣布推出Qwen3和DeepSeek v3.1,这两款产品首次在Amazon Bedrock上亮相,并正式对外提供服务,再次引发全球生成式AI市场对Amazon Bedrock的关注。
根据DeepSeek v3.1的部分测试成绩,这些成绩来自DeepSeek官方文档。
Amazon Bedrock最初以“大模型货架”的形式出现在亚马逊云科技的客户面前,其核心理念是“Choice Matters”(选择大于一切),旨在为不同业务提供最合适的基础模型。因此,自产品发布以来,主流模型将以最快的速度上架Amazon Bedrock供客户选择,且整体“供货”数量是市场竞争对手的两倍多,达到二百余款。
“Choice Matters”理念的提出,源于对基础模型能力的一个判断:行业内不存在一个在所有场景中性能、性价比都为最优的通用模型。回顾2025年基础模型厂商不断变化的竞争态势,以及不同模型针对不同地区服务政策的变化,使这一理念变得更加实际。
从这一点来看,亚马逊云科技一直秉持的“Choice Matters”,已经是一个相对委婉的说法——如果模型选择不够灵活多样,企业正在推进的AI软件策略可能会陷入被动。
2023年,亚马逊云科技首次提出“Choice Matters”理念,但当时的行业尚未就此达成共识。虽然在逻辑上可能认可,但在情感上多少有些将信将疑。因为有两个技术推论模糊了当时的行业认知。
第一个推论来自资本方,普遍认为大模型训练成本高昂,万卡集群是入场券,闭源模型占据主导,开源模型数量有限,“百模大战”将收缩为几家巨头之间的竞争,选择本就不多。
第二个推论来自技术方,认为从数据到架构,大语言模型的进化空间都不大。在数据层面,高质量的数据是有限的,没有足够的数据就无法产生新的“智能涌现”。在架构层面,Transformer仍是“唯一解”,短期内看不到更优的替代方案。因此,关于大模型的“技术摸高”将在短期内结束,模型厂商的研发重点将从基础模型性能提升转向服务垂直行业的解决方案。
这两个推论的影响力有多大?一个知名的行业投资人和云计算公司都是第一个推论的拥趸。而像百川智能及其他几家知名公司则对第二个推论深信不疑,过早放弃了对基础模型的技术探索,也间接错过了AI Agent的红利。
实际上,技术摸高不是一个短期行为,大模型的技术发展曲线依旧足够陡峭,市场选择也足够丰富。围绕单一模型构建的AI能力,有可能会被新的基础模型突破所折叠。这种情况常见于定制化的To B AI解决方案。
在2025年1月以前,基于开源模型能力完成交付验收的定制化AI解决方案,几乎全部因为DeepSeek的发布变得不合时宜。而后来交付的部分方案在Qwen3、Kimi K2、DeepSeek v3.1陆续发布后又被再次丢进技术的“垃圾桶”——半年刷新三次,生动地解释了“单一模型解决方案”的巨大短板。
此外,在2025年音视频模型的技术演进速度也在加快,AI短剧成了“蓝海市场”,未来市场规模可能达到千亿级。那么对于大量新成立的工作室而言如何构建和选择工具也是核心问题。
毫无疑问无论是企服行业、AI短剧行业还是正在推动AI落地业务的公司而言能够应对行业波动灵活多元化的MaaS基础设施都是必须的。
在坚持投入两年后Amazon Bedrock也几乎成了唯一答案。
抛开令人惊讶的模型数量和上新速度不谈Amazon Bedrock甚至已能为具体行业具体场景提供差异化的模型选型建议。
例如媒体广告行业可以选择Marengo、Pagsus、Stable Diffusion;金融行业可以选择Palmyra x5;重推理场景可以选择DeepSeek - v3.1;文本摘要可以选择Mixtral……比起用DeepSeek解决一切问题的技术方案这让人放心得多。以Palmyra x5为例其上下文窗口为100万Token比一般推理模型高出一个数量级因此更适应财务报告和法律合同分析。
如果考虑到在2025年达到高潮的中企出海趋势“Choice Matters”策略的重要性还在提升——毕竟在模型选型问题上国内与海外完全是两套选型模板、两套采购清单。但无论哪种模型大概率能在Amazon Bedrock的货架上找到。这也是近年来亚马逊云科技实现营收快速增长的原因之一。
2024年亚马逊云科技全球营收突破千亿美元大关“Choice Matters”策略的成功实施功不可没。
Palmyra x5的出现某种程度上映射了大模型的整体发展趋势:从单一走向多元化从具备通识能力演变为具备专业能力。当Agentic AI借助MCP、A2A协议开始调用不同智能体、模型完成精细化分工时“Choice Matters”策略也注定成为未来Agent平台的内生逻辑。
所谓专业能力与精细化分工本质源于不同模型的设计思路和训练数据不同。
还是以Palmyra x5为例。要支持百万级Token上下文是有代价的。首先上下文长度增加可能会导致计算复杂度、内存占用出现平方级增长。而单纯增加上下文并不意味着模型能有效利用所有信息。事实上模型注意力会呈现“U型分布”即更容易关注到上下文开头和结尾的信息而中间部分的信息容易被忽略这被称为“中间迷失”现象。
对于Palmyra x5而言消解“中间迷失”现象势必成为技术团队的重点工作。
反过来看本次新上线的DeepSeek v3.1并非刻意针对金融场景而是更强调Agent能力强调推理效率。对于DeepSeek过去半年多在行业的落地情况来看维持满血版运行已经需要相当的算力成本盲目增加上下文窗口实无比要。
对训练数据的选择也决定了模型在不同场景下的表现。
从已知情况来看DeepSeek v3.1新增的840B Tokens重点提升了代码和数学类的占比以进一步提升逻辑推理和数学能力。
DeepSeek称其为“迈向Agentic AI时代的第一步”那么保守猜测DeepSeek v3.1可能也新增了相当比例的Agentic数据。
Agentic数据是为训练AI智能体(AI Agent)而专门准备的数据其核心在于包含行动轨迹、决策过程和环境交互信息。它超越了传统的纯文本对话数据更注重智能体在完成任务时的多步动作、工具使用、决策逻辑(包括错误尝试和纠正)以及与环境(如API、数据库)的互动。
Qwen 3也很重视代码、数学、Agentic数据同时还特别强调了多语言能力——其中文训练数据仅占比45%在应用场景上支持119种语言。在成本方面Qwen 3的部署成本大幅下降4张H20即可部署Qwen 3满血版显存占用仅为性能相近模型的三分之一。
综合来看如何才能保障AI成功落地业务使AI在每个设计场景下都能达成最佳效果?很显然要灵活选型灵活调用。亚马逊云科技数据和AIGTM副总裁Rahul Pathak在博客中很好地总结了这一问题(基于原文翻译略有编辑):
在考虑模型选择时需要考虑三个关键点:
就第二点“竞争优势”而言Amazon Bedrock已经将其沉淀为了系统级能力。
Amazon Bedrock为模型评估设置了两条核心路径:自动评估和人工评估。自动评估适用于客观指标而人工评估则针对主观判断。后者还可以借用亚马逊云科技官方提供的人工评估团队。无论哪种方式最终都会生成详细的评估报告供决策参考。
如果说AI确实在对部分传统工作进行替代那么传统咨询公司在2023年部分主营业务——模型介绍、推荐与评估——已经被Amazon Bedrock完全替代了。好在这也符合现代企业发展的自然规律:将人员能力逐步沉淀为系统能力最终反哺业务发展
如此来看以Amazon Bedrock为典型呈现的“Choice Matters”策略也正对AI落地行业的整体进程产生深远影响。
本文由主机测评网于2026-04-30发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260441639.html