当前位置:首页 > 科技资讯 > 正文

InfCode引领AI编程进入工程时代

InfCode正引领着AI编程进入工程时代。

自“造词大神”Andrej Karpathy提出“Vibe Coding”概念以来,这一概念热度一直居高不下。只需通过描述“感觉”和意图的提示词,AI就能生成可运行的代码,这种近乎魔法的编程体验让开发者们叹为观止。

InfCode引领AI编程进入工程时代 InfCode AI编程 工程时代 多智能体 第1张

例如,输入提示词:“编写一个Python代码,可视化单行道中交通信号灯的工作情况,车辆以随机速率驶入”,AI就能在几秒钟内生成一个完整的动画模拟程序,包括交通灯的红黄绿切换逻辑、车辆的随机生成机制、停车和通行的判断规则,甚至配有流畅的可视化界面。

然而,尽管Vibe Coding擅长快速原型开发和单脚本编写,但在面对企业级复杂工程时仍显得力不从心。受限于上下文窗口、推理深度以及Agentic模式缺失,它往往难以精准定位大型代码库中深埋的Bug,也极易在处理跨文件系统级修改时引发连锁错误。

此时,中国的初创团队词元无限给出了自己的答案。由清华姚班校友带队设计开发的编码智能体InfCode,在SWE-Bench Verified和Multi-SWE-bench-CPP两项非常权威的AI Coding基准中双双登顶。

InfCode引领AI编程进入工程时代 InfCode AI编程 工程时代 多智能体 第2张

具体来说,InfCode展现的不仅是单点技术突破。在SWE-Bench Verified上,它以79.4%的Pass@1得分拿下SOTA,在MultiSWEbench的C++子集上,更是以25.58%的解决率大幅领先。

这些数字背后,是一套面向企业场景设计的多智能体体系。对于希望在企业场景引入AI Coding的决策者而言,这也许是AI从“单体提效”走向企业“组织进化”的新范式。

AI编程进入智能体时代

人工智能正在改变软件开发范式。

传统的大模型只能生成代码片段,而新一代编码智能体(Coding Agent)强调自主性、全流程覆盖和工程实用性。它们不仅会写代码,还能分解任务、调用工具、运行测试、反复调试,甚至提交补丁。

这些智能体在多个基准上接受评测,其中最具权威的是由普林斯顿大学等提出的SWE‑Bench基准,以及OpenAI于2024年发布的升级版SWE‑Bench Verified。该基准来自真实GitHub项目,每个样本附带自然语言问题描述和完整的测试用例。

词元无限的突破:InfCode智能体

词元无限团队开发的InfCode智能体系统,在这一赛道上取得了突破性成绩:

在SWE‑Bench Verified上,InfCode以Pass@179.4%的得分刷新SOTA(世界最佳)

在Multi‑SWE‑bench的C++子集上达到25.58%的解决率

InfCode引领AI编程进入工程时代 InfCode AI编程 工程时代 多智能体 第3张

研究表明,C++项目通常需要一次修改200多行、涉及7个文件,这远难于JavaScript等高层语言。对比官方报告,领先模型在C++上的解决率往往不足8%。

技术核心:超越RAG的代码意图分析

为突破传统RAG(Retrieval-Augmented Generation)机制的局限,InfCode提出了“代码意图分析(Code Intent Analysis)”机制。

该机制让智能体能够超越字面匹配,理解自然语言背后的“功能意图”,并将其智能映射到项目中的具体实现单元(函数或类)。这一过程融合了语义推理与架构理解,使模型能在无堆栈信息的条件下仍然精准地锁定问题上下文。

多智能体生成:对抗式的代码补丁与测试补丁双智能体生成

InfCode首创对抗式双智能体架构:

  • 代码补丁生成器(Code Patch Generator)负责修改代码以通过当前测试集;
  • 测试补丁生成器(Test Patch Generator)则负责生成更强的测试用例。

二者在一个闭环中交替迭代,让补丁在鲁棒性与完备性上持续演化。

工程化细节:生成与筛选范式

InfCode的修复流程分为两阶段:生成(Generate)与筛选(Select)。

InfCode引领AI编程进入工程时代 InfCode AI编程 工程时代 多智能体 第4张

这种广泛探索+精准筛选的策略使InfCode能产出质量更高的修复补丁。

背后站着一支“创业天团”

技术突破的背后,是一支被业内称为“创业天团”的豪华阵容。词元无限的核心团队不仅拥有顶尖的技术实力,更难得的是将技术前瞻、产品化能力与商业化思维三者融为一体。