智东西11月20日报道,今日,马斯克创立的xAI公司宣布对其API进行两项重大升级:推出专为智能体设计的新型模型Grok 4.1 Fast,具备快速、低成本的特点,同时发布了智能体工具xAI Agent Tools API,旨在简化开发者构建自主系统的流程。
Grok 4.1 Fast被官方称为迄今为止工具调用性能最优的模型,其上下文窗口高达200万token,能够高效处理复杂推理和智能体任务,尤其在客户支持、财务分析等实际商业场景中表现突出,可实现精准的决策与执行。
▲基于Grok 4.1 Fast搭建的航班改签应用示例(图源:xAI)
该模型在人工智能分析智能指数(AII)中排名跃升四位,位列第六,仅次于排名第五的Grok 4。特别值得一提的是,在智能体调用基准测试𝜏²-Bench Telecom中,Grok 4.1 Fast以93.3%的得分登顶,凭借更低的成本超越了GPT-5.1(high)、Gemini 3 Pro等竞品,相比Grok 4 Fast提升了27个百分点。xAI还强调,Grok 4.1 Fast在事实准确性方面显著改进,幻觉率较Grok 4 Fast降低了50%,增强了模型在实际应用中的可靠性。
▲AII指数排名变化(图源:Artificial Analysis)
Agent Tools API为智能体提供了访问实时X数据、网络搜索、远程代码执行等一系列功能,使开发者能够轻松集成外部工具,扩展模型能力边界。
Grok 4.1 Fast与Agent Tools API的组合,让开发者可以快速构建面向工具调用和智能体搜索的生产级智能体应用,无需从零搭建复杂的基础设施。
智东西第一时间对Grok 4.1 Fast进行了实测,发现正如官方所述,其在实时信息检索能力上较Grok 4 Fast有明显提升,但在经典编程任务中却出现了意外失误。这可能意味着在追求更高智能体工具调用效率和响应速度的过程中,模型在特定维度的性能有所取舍。
定价方面,Grok 4.1 Fast输入价格为0.2美元/百万tokens,缓存输入价格为0.05美元/百万tokens;输出价格为0.5美元/百万tokens。Agent Tools API调用价格为5美元起/1000次成功调用。
在12月3日之前,用户可免费体验上述服务两周,为开发者提供了充足的测试和集成时间。
▲Grok 4.1 Fast及Agent Tools API定价详情(图源:xAI)
API地址:
https://console.x.ai/team/default/api-keys
OpenRouter体验地址:
https://openrouter.ai/x-ai/grok-4.1-fast
Grok 4.1 Fast针对实际企业用例进行了专项训练,尤其在智能体调用方面实现了显著突破。通过在模拟环境中进行强化学习,模型接触了数十个领域的多种工具,从而在τ²-bench Telecom测试中取得了优异成绩,以更低成本超越了GPT-5.1(high)、Gemini 3 Pro、Claude 4.5 Sonnet等主流模型。τ²-bench Telecom是一个专门评估智能体在真实客户支持场景中使用工具能力的基准测试,具有很高的参考价值。
▲Grok 4.1 Fast在各项基准测试中的表现(图源:xAI)
Grok 4.1 Fast在工具调用方面尤为擅长。随着开发者构建的功能越来越强大的自主智能体不断涌现,这些智能体需要具备长期规划和独立运行的能力,模型必须在速度和成本之间找到平衡。Grok 4.1 Fast正是xAI给出的解决方案:集前沿工具调用性能、极快推理速度和成本效益于一身的模型。
▲Grok 4.1 Fast在工具调用基准上的得分(图源:xAI)
智能体模型面临的一大挑战是随着上下文长度增加,性能可能下降。xAI通过长时域强化学习训练了Grok 4.1 Fast,并重点强化多回合场景,确保其在长达200万个token的上下文窗口中保持稳定性能,满足复杂任务的需求。
▲Grok 4.1 Fast长上下文性能表现(图源:xAI)
智东西第一时间对Grok 4.1 Fast和Grok 4 Fast进行了对比测试,结果显示,Grok 4.1 Fast在实时信息检索方面明显优于Grok 4 Fast,但在经典编程问题上表现失常,不如前代稳定。
当输入经典试题:“模拟一个旋转六边形内弹跳球”,Grok 4 Fast在几秒内生成了正确的模拟。
▲Grok 4 Fast实测表现(图源:智东西)
而新版Grok 4.1 Fast虽然也在几秒内完成,但出现了错误,生成的六边形效果炫酷却未出现小球,与提示要求不符。
▲Grok 4.1 Fast实测表现(图源:智东西)
当测试升级为:“模拟一个旋转六边形内弹跳球,有两个球体积相同,球a的质量是球b的2倍”,Grok 4 Fast依然能在几秒内生成基本正确的模拟。
▲Grok 4 Fast实测表现(图源:智东西)
但新模型Grok 4.1 Fast直接出现黑屏,无法完成模拟,且多次尝试修复无效。这可能是在兼顾智能体调用、速度和性能时面临的挑战,但Grok 4.1 Fast是否在优化智能体能力时牺牲了部分通用性能,仍需更多案例验证。
▲Grok 4.1 Fast实测黑屏(图源:智东西)
不过,在依赖工具的实时信息检索上,Grok 4.1 Fast表现优于Grok 4 Fast。当输入“关于本周xAI的重要新闻”,Grok 4.1 Fast输出的信息时效性更强、更全,覆盖了“今天Grok 4.1 Fast发布”的最新动态;而Grok 4 Fast未能涵盖当天的最新消息。
▲Grok 4.1 Fast实测新闻检索(图源:智东西)
▲Grok 4 Fast实测新闻检索(图源:智东西)
xAI同步推出了服务器端工具Agent Tools API,使Grok 4.1 Fast能够作为完全自主的智能体运行。开发者只需几行代码,就能让Grok实现网页浏览、X帖子搜索、代码执行、上传文档检索等多种功能。
▲简单几行代码即可让Grok调用外部工具(图源:xAI)
这些工具完全运行在xAI的基础架构上,开发者无需管理API密钥、速率限制、沙箱或检索管道。Grok会自主决定何时及如何使用工具,通常会在多个回合中并行调用多个工具,直到获得所需信息,最终给出答案。
▲Agent Tools API应用案例示意(图源:xAI)
Agent Tools API显著扩展了xAI基础Grok模型的能力,主要功能包括:
搜索工具:利用实时X数据和互联网搜索,快速掌握时事与趋势。
文件搜索:智能搜索并检索用户上传文件中的相关文档,附带引用信息。
代码执行:在安全沙箱中执行Python代码,用于数据分析与模拟运行。
MCP工具:无缝连接到外部MCP服务器,从而访问丰富的自定义第三方工具。
与Agent Tools API结合后,实时信息检索和深度研究成为Grok 4.1 Fast的核心优势之一。凭借与X生态系统的深度集成和网页浏览能力,由xAI API驱动的搜索智能体在内部基准测试中取得了高分。
X Browse是xAI内部用于评估智能体在X平台上进行多跳搜索和浏览能力的基准。Grok 4.1 Fast在事实性方面树立了新标准,与Grok 4 Fast相比,幻觉率降低了一半,同时在FActScore评估中仍保持与Grok 4相当的性能。
▲Grok 4.1 Fast事实准确性表现(图源:xAI)
xAI将在API上提供Grok 4.1 Fast的两个变体:
grok-4-1-fast-reasoning,旨在实现最大智能。
grok-4-1-fast-non-reasoning,擅长即时回复。
接下来的两周,xAI的模型和工具将在部分平台上免费提供:
xAI与OpenRouter合作,免费提供Grok 4.1 Fast。
xAI通过xAI Agent Tools API完全免费提供所有智能体工具。
当下,AI圈的模型和产品迭代正加速向智能体方向聚焦,市场需求倒逼技术升级。当开发者构建的功能越来越强大的自主智能体成为主流,模型必须提供更优的智能体服务,同时兼顾速度和成本。
马斯克本次推出Grok 4.1 Fast,并配套提供易于集成的Agent Tools API,在一众方案中更强调与实际应用场景的结合。围绕AI智能体商业化落地的军备竞赛已悄然升级,xAI凭借其强大的应用生态占据一定优势。然而,模型性能的稳定性依然是关键,Grok 4.1 Fast的实际表现还需更多实测验证。
本文由主机测评网于2026-02-18发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260225704.html