当前位置:首页 > 科技资讯 > 正文

Feeling AI CodeBrain-1全球第二,中国AI崛起

【导读】Feeling AI凭借CodeBrain-1在权威榜单Terminal-Bench 2.0中强势突围,仅次于OpenAI最新旗舰,位居全球第二。这不仅打破了美系巨头的绝对垄断,更标志着中国AI在Agentic AI(智能体)复杂任务规划与自主编码领域的工程化能力已达到世界顶尖水平。

在全球科技界,弥漫着辞旧迎新的气息,同时也夹杂着一股前所未有的竞争硝烟。

Anthropic祭出了Claude Opus 4.6,OpenAI则以GPT-5.3-Codex强势回应。

双方在技术之巅的对决看似是老生常谈的「王座之争」,但在平静的水面之下,竞争的底层逻辑已然悄然改写。

全球大模型竞赛已正式从实验室里的「参数博弈」突变为残酷的「实战进化」。

这一次,巨头们不再沉迷于跑分数据的虚幻繁荣,而是将目光死死锁定了架构的严谨性与自主工作流的长效续航——

能否在真实商业世界中「破局」,成为了唯一的度量衡。

在硬核指标的正面交锋中,OpenAI和Anthropic两家巨头均选择Terminal-Bench 2.0作为实力背书:Opus 4.6在Agentic Terminal Coding Task上以 65.4%的胜率展现了卓越的智能体编码能力;而Sam Altman凭借5.3-Codex+ Simple Codex的组合创下的 77.3%(75.1%)高分,宣称其登顶全球编码性能之巅。

正如NVIDIA首席科学家Jim Fan所言:真实的终端环境是AI的「魔鬼训练场」。

在闭环环境中自我进化,已成为衡量模型工程能力的终极标尺。

令人振奋的是,在这一权威赛道上,中国的AI初创团队Feeling AI异军突起——其自研的CodeBrain-1在GPT-5.3-Codex底座模型的加持下,以 72.9%(70.3%)的惊艳战绩跃升全球榜单第二,成为前十强中唯一的中国新锐。

Feeling AI CodeBrain-1全球第二,中国AI崛起  CodeBrain-1 Agentic Terminal-Bench 2.0 第1张

刚拿下Agentic Memory SOTA,Feeling AI又上大分

5天前,Feeling AI团队在深夜发布MemBrain1.0,LoCoMo / LongMemEval / PersonaMem-v2等多项主流记忆基准评测中拿下全新SOTA,反超MemOS、Zep和EverMemOS等记忆系统和全上下文模型。

在KnowMeBench Level III两个难度等级最高的评测中更是比现有评测结果大幅提升超300%。

在AI技术圈和资本押注的新风口——Agentic Memory方向先打出了第一张牌。

强大的记忆能力以及适配模型原生的层级化记忆系统,意味着Agentic AI正从模型能力逐步走向用户体验层面的范式跃迁。

紧随MemBrain 1.0的余热,Feeling AI昨晚又打出了第二张牌——CodeBrain。

作为具备动态规划与策略调整能力的「进化大脑」,CodeBrain-1迅速跻身权威基准Terminal-Bench2.0榜单全球第二,仅次于OpenAI 5.3-Codex的官配Simple Codex。

在Feeling AI的官方媒体中,其一直在强调动态交互是世界模型通向AGI的终极拼图。

其原创的跨模态分层架构提出了三层核心能力——负责理解、记忆与规划的 InteractBrain,负责能力执行的 InteractSkill,以及负责渲染呈现的 InteractRender,共同构成了其技术护城河。

目前已经亮剑的MemBrain与CodeBrain 都属于InteractBrain核心层,精准定位在复杂动态交互场景下的深度理解与长程规划。

如此看来,这两项在全球拿下极具说服力成绩的工作应该并非偶然,而是早有布局。

CodeBrain-1,会动态调整计划与策略的「大脑」

Feeling AI CodeBrain-1全球第二,中国AI崛起  CodeBrain-1 Agentic Terminal-Bench 2.0 第2张

在Terminal-Bench官方评测网站的最新排名显示,CodeBrain-1仅次于Open AI的Simple Codex(GPT-5.3-Codex),Factory的Droid使用Anthropic最新基模Claude Opus 4.6排名第三。

在技术实现上,CodeBrain-1 专注打磨了两个直接影响「能否成功且高效地完成任务」的环节:

  • Useful Context Searching:只用「真正有用」的上下文。
  • Validation Feedback:让失败真正变成信息。

为什么AI巨头都在Terminal-Bench 2.0 上较量?

Terminal-Bench 是由斯坦福大学与 Laude Institute 联合打造的开源基准,被公认为 AI 智能体在真实命令行(CLI)环境下端到端执行能力的「金标准」。