当前位置：首页 > 科技资讯 > 正文

Feeling AI CodeBrain-1全球第二，中国AI崛起

主机测评网
科技资讯
2026-04-11
963

【导读】Feeling AI凭借CodeBrain-1在权威榜单Terminal-Bench 2.0中强势突围，仅次于OpenAI最新旗舰，位居全球第二。这不仅打破了美系巨头的绝对垄断，更标志着中国AI在Agentic AI（智能体）复杂任务规划与自主编码领域的工程化能力已达到世界顶尖水平。

在全球科技界，弥漫着辞旧迎新的气息，同时也夹杂着一股前所未有的竞争硝烟。

Anthropic祭出了Claude Opus 4.6，OpenAI则以GPT-5.3-Codex强势回应。

双方在技术之巅的对决看似是老生常谈的「王座之争」，但在平静的水面之下，竞争的底层逻辑已然悄然改写。

全球大模型竞赛已正式从实验室里的「参数博弈」突变为残酷的「实战进化」。

这一次，巨头们不再沉迷于跑分数据的虚幻繁荣，而是将目光死死锁定了架构的严谨性与自主工作流的长效续航——

能否在真实商业世界中「破局」，成为了唯一的度量衡。

在硬核指标的正面交锋中，OpenAI和Anthropic两家巨头均选择Terminal-Bench 2.0作为实力背书：Opus 4.6在Agentic Terminal Coding Task上以 65.4%的胜率展现了卓越的智能体编码能力；而Sam Altman凭借5.3-Codex+ Simple Codex的组合创下的 77.3%（75.1%）高分，宣称其登顶全球编码性能之巅。

正如NVIDIA首席科学家Jim Fan所言：真实的终端环境是AI的「魔鬼训练场」。

在闭环环境中自我进化，已成为衡量模型工程能力的终极标尺。

令人振奋的是，在这一权威赛道上，中国的AI初创团队Feeling AI异军突起——其自研的CodeBrain-1在GPT-5.3-Codex底座模型的加持下，以 72.9%（70.3%）的惊艳战绩跃升全球榜单第二，成为前十强中唯一的中国新锐。

Feeling AI CodeBrain-1全球第二，中国AI崛起 CodeBrain-1 Agentic Terminal-Bench 2.0 第1张

刚拿下Agentic Memory SOTA，Feeling AI又上大分

5天前，Feeling AI团队在深夜发布MemBrain1.0，LoCoMo / LongMemEval / PersonaMem-v2等多项主流记忆基准评测中拿下全新SOTA，反超MemOS、Zep和EverMemOS等记忆系统和全上下文模型。

在KnowMeBench Level III两个难度等级最高的评测中更是比现有评测结果大幅提升超300%。

在AI技术圈和资本押注的新风口——Agentic Memory方向先打出了第一张牌。

强大的记忆能力以及适配模型原生的层级化记忆系统，意味着Agentic AI正从模型能力逐步走向用户体验层面的范式跃迁。

紧随MemBrain 1.0的余热，Feeling AI昨晚又打出了第二张牌——CodeBrain。

作为具备动态规划与策略调整能力的「进化大脑」，CodeBrain-1迅速跻身权威基准Terminal-Bench2.0榜单全球第二，仅次于OpenAI 5.3-Codex的官配Simple Codex。

在Feeling AI的官方媒体中，其一直在强调动态交互是世界模型通向AGI的终极拼图。

其原创的跨模态分层架构提出了三层核心能力——负责理解、记忆与规划的 InteractBrain，负责能力执行的 InteractSkill，以及负责渲染呈现的 InteractRender，共同构成了其技术护城河。

目前已经亮剑的MemBrain与CodeBrain 都属于InteractBrain核心层，精准定位在复杂动态交互场景下的深度理解与长程规划。

如此看来，这两项在全球拿下极具说服力成绩的工作应该并非偶然，而是早有布局。

CodeBrain-1，会动态调整计划与策略的「大脑」

Feeling AI CodeBrain-1全球第二，中国AI崛起 CodeBrain-1 Agentic Terminal-Bench 2.0 第2张

在Terminal-Bench官方评测网站的最新排名显示，CodeBrain-1仅次于Open AI的Simple Codex（GPT-5.3-Codex），Factory的Droid使用Anthropic最新基模Claude Opus 4.6排名第三。

在技术实现上，CodeBrain-1 专注打磨了两个直接影响「能否成功且高效地完成任务」的环节：

Useful Context Searching：只用「真正有用」的上下文。
Validation Feedback：让失败真正变成信息。

为什么AI巨头都在Terminal-Bench 2.0 上较量？

Terminal-Bench 是由斯坦福大学与 Laude Institute 联合打造的开源基准，被公认为 AI 智能体在真实命令行（CLI）环境下端到端执行能力的「金标准」。

云服务器性价比服务器免费vps

本文由主机测评网于2026-04-11发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260435975.html

上一篇

2026年澳大利亚代理服务器配置与技术使用指南

下一篇

CF服务器人数已满怎么办？优化与解决方案