当一款模型兼具卓越的智能体(Agent)能力、高效执行且幻觉率极低时,会发生什么?答案是显而易见的:
开发者与用户将迅速以真实的资金与Token来「投票」支持。
这正是全球AI界正在发生的盛事。阶跃星辰的开源模型Step 3.5 Flash发布后,迅速风靡全球,不仅在OpenRouter首日便跃居Fastest Models全球最快模型之列,更在短短两天内登顶Trending全球趋势榜榜首。
OpenRouter,作为全球AI模型聚合平台,汇聚了几乎所有知名的开源与闭源模型,吸引了众多全球AI开发者与用户。榜单数据来自开发者与用户的真实API调用,已成为评估大模型性能的重要「试金石」,尤其是Trending全球趋势榜,关注模型的实际应用而非单纯的参数或跑分。
这也不难看出Step 3.5 Flash此次「全球第一」的含金量。
2月2日,阶跃星辰发布开源模型Step 3.5 Flash,迅速吸引了行业关注。首要关注点便是其「智能密度」。
基准测试显示,Step 3.5 Flash在数学推理(AIME 2025评分97.3)和代码修复(SWE-bench Verified达74.4%)上表现卓越,PaCoRe强化版甚至将AIME 2025成绩提升至近乎满分的99.9。
但对开发者而言,更具吸引力的是其「以巧见大」的能力。
阶跃星辰公开了Step 3.5 Flash的技术报告,详细介绍了其创新模型结构。它采用稀疏混合专家(MoE)架构,在保持1960亿总参数的同时,每个Token处理时动态选择最适合的「专家」,仅需110亿激活参数即可实现前沿级智能。
这如同一支拥有196名顶尖专家的智囊团,面对具体代码任务时,系统能瞬间精准选出最专业的11人。开发者与用户支付的是11B模型的成本,却可获得196B模型的思考深度,性能媲美GPT-5.2 xHigh、Gemini 3 Pro等前沿模型。
为应对长上下文瓶颈,Step 3.5 Flash还通过3:1滑动窗口与全局注意力混合架构(SWA+Full Attention)实现256K长上下文的高效处理,极大节省显存。这些创新在一定程度上解决了Agent时代的成本与效果矛盾。
而Step 3.5 Flash的「巧」不止于此。测试显示其支持100–300 TPS(每秒Token数)的生成吞吐量,部分场景下甚至可达最高350 TPS,远超去年50-100 TPS的主流水平。
实现这一点的关键在于MTP-3(三路多Token预测)技术。传统模型推理类似「蹦豆子」,而MTP-3允许模型在生成当前内容时同时预测后续多个Token。这不仅是速度提升,也改变了模型的思考逻辑——让模型在行动前预判后续步骤。
在Agent场景下,「连贯性」至关重要,减少了模型在复杂逻辑中的「卡顿」与「失忆」,使原本断续的AI操作变得流畅高效。
实际表现如何?
YouTube科技博主Bijan Bowen的实测显示,Step 3.5 Flash能准确区分瑞典设计与纽约金融风格的差异,从字体、布局到交互逻辑持续优化。甚至生成了一个功能完备的浏览器操作系统(WebOS),是测试的模型中唯一能运行经典游戏「Memory Game」的模型。
这种能力体现了模型知识容量、推理与执行能力的叠加。另一方面,有用户在Discord上用Mac(M3 Max)本地部署运行Step 3.5 Flash,效果超预期,性能达硬件理论效率的70%。他提到,该模型幻觉率低,输出可靠回答与行为,多语言混用场景下错误率也低。
更灵活的部署优势、更低的推理成本及实际AI使用场景下的强大与易用性,使Step 3.5 Flash的火爆成为必然。
Step 3.5 Flash发布后,阶跃星辰CTO朱亦博提到团队在Step 2阶段虽沿大参数、强对话能力推进,但意识到此路不通。
“不同智能阶段需不同基模结构。”他意识到L1 Chatbot时代的基础结构不适用于L2 Reasoner(推理模型),而L3 Agent时代需新基模结构。
在此背景下,Step 3.5 Flash的训练目标聚焦于强逻辑、高效长上下文处理及快速推理能力。这些决定模型的可用性、易用性及纠错与自我改进能力。
在Agent场景下,用户关注完成任务的速度、准确与稳定性。
Bijan Bowen测试AI生成飞行模拟、赛车游戏时发现,Step 3.5 Flash初始版本虽有小瑕疵,但通过提示词反馈后能在原基础上迭代优化,开发质量显著提升。
自2022年底以来,生成式AI的爆发证明大模型可改变内容生产、信息获取乃至人与软件的交互方式。但Agent时代的真正到来带来了不同。
“我们更多将生活、工作中的任务交给AI协作甚至完成。”
本文由主机测评网于2026-04-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260435453.html