InfCode正引领着AI编程进入工程时代。
自“造词大神”Andrej Karpathy提出“Vibe Coding”概念以来,这一概念热度一直居高不下。只需通过描述“感觉”和意图的提示词,AI就能生成可运行的代码,这种近乎魔法的编程体验让开发者们叹为观止。
例如,输入提示词:“编写一个Python代码,可视化单行道中交通信号灯的工作情况,车辆以随机速率驶入”,AI就能在几秒钟内生成一个完整的动画模拟程序,包括交通灯的红黄绿切换逻辑、车辆的随机生成机制、停车和通行的判断规则,甚至配有流畅的可视化界面。
然而,尽管Vibe Coding擅长快速原型开发和单脚本编写,但在面对企业级复杂工程时仍显得力不从心。受限于上下文窗口、推理深度以及Agentic模式缺失,它往往难以精准定位大型代码库中深埋的Bug,也极易在处理跨文件系统级修改时引发连锁错误。
此时,中国的初创团队词元无限给出了自己的答案。由清华姚班校友带队设计开发的编码智能体InfCode,在SWE-Bench Verified和Multi-SWE-bench-CPP两项非常权威的AI Coding基准中双双登顶。
具体来说,InfCode展现的不仅是单点技术突破。在SWE-Bench Verified上,它以79.4%的Pass@1得分拿下SOTA,在MultiSWEbench的C++子集上,更是以25.58%的解决率大幅领先。
这些数字背后,是一套面向企业场景设计的多智能体体系。对于希望在企业场景引入AI Coding的决策者而言,这也许是AI从“单体提效”走向企业“组织进化”的新范式。
人工智能正在改变软件开发范式。
传统的大模型只能生成代码片段,而新一代编码智能体(Coding Agent)强调自主性、全流程覆盖和工程实用性。它们不仅会写代码,还能分解任务、调用工具、运行测试、反复调试,甚至提交补丁。
这些智能体在多个基准上接受评测,其中最具权威的是由普林斯顿大学等提出的SWE‑Bench基准,以及OpenAI于2024年发布的升级版SWE‑Bench Verified。该基准来自真实GitHub项目,每个样本附带自然语言问题描述和完整的测试用例。
词元无限团队开发的InfCode智能体系统,在这一赛道上取得了突破性成绩:
在SWE‑Bench Verified上,InfCode以Pass@179.4%的得分刷新SOTA(世界最佳)
在Multi‑SWE‑bench的C++子集上达到25.58%的解决率
研究表明,C++项目通常需要一次修改200多行、涉及7个文件,这远难于JavaScript等高层语言。对比官方报告,领先模型在C++上的解决率往往不足8%。
为突破传统RAG(Retrieval-Augmented Generation)机制的局限,InfCode提出了“代码意图分析(Code Intent Analysis)”机制。
该机制让智能体能够超越字面匹配,理解自然语言背后的“功能意图”,并将其智能映射到项目中的具体实现单元(函数或类)。这一过程融合了语义推理与架构理解,使模型能在无堆栈信息的条件下仍然精准地锁定问题上下文。
InfCode首创对抗式双智能体架构:
二者在一个闭环中交替迭代,让补丁在鲁棒性与完备性上持续演化。
InfCode的修复流程分为两阶段:生成(Generate)与筛选(Select)。
这种广泛探索+精准筛选的策略使InfCode能产出质量更高的修复补丁。
技术突破的背后,是一支被业内称为“创业天团”的豪华阵容。词元无限的核心团队不仅拥有顶尖的技术实力,更难得的是将技术前瞻、产品化能力与商业化思维三者融为一体。
本文由主机测评网于2026-05-22发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260545769.html