文|邓咏仪
编辑|苏建勋
短短半年,杨萍便亲身感受到了AI Coding赛道的惊人热度。
2024年,Vibe Coding领域发展迅猛。Cursor的ARR从2023年的100万美元飙升至2024年11月的6500万美元,估值在不到四个月内增长超过六倍。
彼时,杨萍刚将字节的首款Coding产品MarsCode推向市场不久。作为技术研发负责人,自2021年起,她便带领百人团队在字节内部探索AI在软件领域的应用,所打造的产品曾服务公司内部数万名研发人员,助力节省了数亿元的研发预算。
“当时我们就意识到,AI在编程领域的应用潜力巨大,而用户更关注的是能否直接理解并有效使用。”她对《智能涌现》表示。
但随着赛道急剧变化,杨萍内心涌起了强烈的紧迫感。
变化体现在两个维度:一方面,这些面向C端的Coding产品不仅获得了资本市场的高估值,收入也大幅增长,证实了市场对AI编程工具的真实需求;
另一方面,市场格局正在重塑——无论是国内还是海外,To C方向的Coding产品已插满先行者的旗帜,但越来越多厂商开始转向To B市场,企业级需求正迎来爆发。
这些变化让她意识到,创业时机已不容再等。2025年7月,杨萍与两位联创正式成立新公司“词元无限”,旨在为企业客户提供AI Coding Agent服务。
近期,词元无限正式完成了数千万元天使轮融资,投资方为某软件产业CVC。本轮融资由航行资本担任长期财务顾问。
词元无限还吸纳了毕业于清华姚班、来自字节等公司的资深人才。CTO王伟为清华姚班校友,曾任国内知名具身机器人公司与大模型创业公司的技术合伙人。商业化负责人李莹拥有十余年AI产业落地经验,曾在大模型To B领域主导完成数亿元规模的项目落地。
市面上的通用AI编程工具虽能快速生成代码,迅速编写各类小型应用,但在面对企业复杂的遗留系统、技术栈和严苛的业务规范时,往往难以适应。
例如,一个典型的金融场景:银监会规定开户流程必须包含特定合规步骤,而通用AI工具可能根据公开数据自行设计出若干步骤。即便代码生成再快,在企业眼中也是不可用的废代码。
为了让Vibe Coding真正进入企业级生产场景,硅谷正复兴一个经典概念——FDE(前沿部署工程师)。
这一模式由Palantir于2010年提出,目前已在AI行业掀起招聘热潮,包括OpenAI、Anthropic在内的企业均宣布将包括FDE在内的应用AI团队扩大数倍规模。
词元无限希望用AI打造类似的Agent服务——让高水平工程师直接深入客户现场,既是技术专家,又是商业顾问,帮助企业将前沿AI技术应用到生产环境中。
InfCode
12月初,词元无限的核心产品InfCode正式上线首个版本,形态为插件+企业级AI编程平台。InfCode助力企业完成代码治理、补全、审查、任务规划等工作,相当于一名中阶研发工程师。
InfCode通过两层机制解决这一问题:第一层是标准化对接——通过内置的MCP Server连接器,快速集成飞书、企业OA等常见办公系统,使AI能实时查询企业内部文档和规范;
第二层是个性化适配——针对每家企业独特的微服务架构、内部流程和遗留系统,提供开放接口,由企业IT团队进行轻量级适配。
在实际POC验证中,词元无限当前合作的客户案例显示,研发效率提升了近40%,AI生成代码的可用率达到88%以上,质量达到中级程序员水平。
更重要的是,词元无限并不关注中间过程的AI准确率,而是直接衡量项目交付的价值——比如人效、项目时间的提升等。
目前,在全球权威智能体评测基准SWE-Bench Verified上,InfCode以79.4%的得分刷新了世界最佳纪录,超过公开排行榜上GPT-5、Claude等顶尖模型65%左右的成绩。
在2025年的中国,做To B市场依旧是个不易的决定。在上一个AI 1.0时代,不少AI公司的发展表明,若只有单点技术能力,很容易陷入无穷无尽的定制化、大项目中。
不过,杨萍认为,AI Coding或许能让To B落地走出一条不同的道路。
这背后,既有基模发展迅速的原因——2025年,基础模型厂商在Agent能力上不遗余力,新推出的Gemini 3 flash就比数月前的Gemini 2.5 pro强上数倍,带来的业务价值立竿见影;
二是C端AI产品正迅速普及,如Cursor、Replit等垂类Coding产品,以及ChatGPT等通用AI助手,都让企业研发群体对AI的接受度和付费意愿远超预期。
杨萍表示,最终Agent的商业模式将走向以结果为导向的方式(RaaS, Result as a Service),让企业管理者能清晰计算投资回报率。“C端产品的普及已完成对企业研发人员的市场教育,现在的关键是解决最后一公里的业务理解问题。”杨萍说。
在第一轮融资完成之际,词元无限的几位联创也与《智能涌现》聊了聊To B AI Coding的痛点与机遇。
以下为访谈原文,经《智能涌现》编辑整理:
《智能涌现》:咱们从创业的起点开始聊吧,一开始你在字节做Coding产品,再到创业,整个过程背后是如何考虑的?
杨萍:2018年到2024年,我在字节主要负责智能化和软件工程相关工作。在大语言模型爆火之前,我们已在研究一些深度学习和生成学习模型,但那时主要还是学术探索。
从2021年起,我和团队持续观察并尝试强化学习相关应用,包括深度学习在代码场景的应用等。
字节内部的AI Coding产品始于2022年中,我们完整经历了从0到1的过程。后来我于2024年8月离开,经过一段时间学习后,在今年7月创立了词元无限。
《智能涌现》:2024年8月,那时Marscode刚推出不久,离开自己一手带起来的产品,是否有所犹豫?
杨萍:最关键的是大模型浪潮下机会众多。人应在巅峰时期做选择,而非落寞时。否则,你凭什么说服别人真金白银投给你?
创业者心态应是干得好时出来高举高打,此时恰恰有经验,也有自信。
在我们成立公司前,Cursor、Replit等明星公司基本在2023年大半年间市场表现和估值开始猛涨。
此事对我触动很大,觉得在大厂,竞争跑得也不一定有外面快,创业时机至关重要。
《智能涌现》:以前你们做的AI Coding产品直接面向开发者,但新公司词元无限选择了面向企业端市场,为何转变方向?
杨萍:To B和To C在开发者工具上的区别,其实没传统软件产品那么大。我们强调企业级,更多是指想要面对的问题域——企业级场景需要规模化的Agent能力,解决软件交付全流程问题。
举个例子,很多个人Vibe Coding产品主打一句话生成一两万行的demo项目。但你可能很难相信,Vibe Coding能给你生成一个1000万行级别、能增加营收或承载核心业务的软件。
我们更关注这种严肃级的企业级编程场景,挑战更复杂的规模化问题。
《智能涌现》:用一句话概括,词元无限的产品能做什么?
杨萍:我们是一个聚焦企业级场景的AI Coding Agent平台。
从底层定义上,我们提供的不仅是工具,还有Agent的平台级能力。这些Agent会深入到企业级软件开发的各个环节,如企业级的Coding、Debugging等,将AI能力深度集成到开发者常用的IDE中。
《智能涌现》:企业级开发场景中,为何无法用Vibe Coding产品解决需求,用户痛点是什么?
杨萍:企业开发者最头疼的是在需求、开发、测试、运维等多个平台间频繁切换,这中间有巨大的数据和流程壁垒。比如在金融、医药等关键行业,每次代码改动都要对业务负责。
严肃编程场景中,结果相对确定,对服务稳定性有要求,需按特定上下文指导用户完成整个Coding过程。
所以本质上,这与Vibe Coding是相悖的。Vibe Coding产品往往更多依赖基础模型能力,工程层较薄。它不完全是你个人意愿的承载,你得理解业务需求,按业务规范写业务代码,在限制下做项目。
《智能涌现》:能举个例子说明企业客户实际遇到的困难,以及你们如何解决的吗?
王伟:企业开发往往是几十甚至上百人协作,因此产品必须能与企业现有研发流程自然对接。
比如开发电商系统的前端页面,若只用Vibe Coding,写出的页面可能跟后端系统逻辑对不上;但我们的AI Coding Agent能连接到多个后端项目,参考相应代码接口和文档,确保前后代码逻辑一致并能真正跑通。
Vibe Coding产品在B端场景效果有限,正因它们并非基于此类场景设计。
以金融账户风控逻辑为例,银监会有明确政策指导文件,要求开户流程必须检查若干步。若简单使用Vibe Coding产品生成,它可能会很“聪明”地设计出复杂检查流程,但最终结果货不对板,完全不满足基本流程要求。
我们的Coding Agent要解决的就是这种依赖复杂、代码量大且关联多的场景。例如企业系统“存量项目”,动辄十几万甚至上百万行的代码仓库,模型的上下文空间肯定不够。
这就需在Agent层面优化设计。我们的Agent设计了两种机制:内功方面主要针对受限上下文窗口下的上下文优化,包括动态压缩、加载卸载机制,以解决模型先天局限性;外功方面引入更多连接,通过mcp等开放协议将企业研发过程中的各类信息(包括文档、外部依赖、数据库等)动态引入Agent环境。这种内外兼修的方式取得了不错效果。
《智能涌现》:用一个具体案例说明你们的产品如何帮助用户解决问题?
王伟:我们目前有一个典型合作案例,是与一家金融上市公司做的。实施分两步:
第一步是提供标准化产品,重点关注上下文工程,确保智能体自身设计能避免上下文长度不够的问题。
第二步是解决“信息从哪里来”的问题。
这部分信息对接分两类:一是标准化的,通过内置MCP Server连接器快速集成git仓库、制品管理系统和文档系统等环境,让Agent能精准读取外部信息;
另一部分是非标的个性化系统,我们开放接口和适配器,客户侧团队快速集成了他们内部的OA系统。
这两步实施下来,最终实现了又快又好的效果。客户实际测试,与中级开发人员的能力水平基本持平,最终帮客户提升了将近40%的人效。
《智能涌现》:这40%是怎么算的?如何定义任务被解决?
王伟:只看最终效果,即直接对比人力投入,比如研发周期(人天)。
这些指标一定与业务目标直接挂钩。在整个开发过程中,我们不拆解中间有多少类型情况,也不管用AI生成后还需多少人力修复或调整。只看这个团队把同样价值的事做完,到底节省了多少人力成本。
从企业管理者视角看,最关心的就是最终交付的价值,而非其他过程指标。
《智能涌现》:那你们的收费模式是怎样的?
李莹:目前我们正在与头部的几家ISV以及大型终端客户进行协议签署和探索。
针对工具类产品,我们会收取License和Agent订阅费;针对平台类产品,除收取一些标准费用外,也在考虑分润模式。
《智能涌现》:你们提到词元无限解决“严肃编程场景”的问题,这与Vibe Coding解决的问题主要区别是什么?
李莹:市面上C端市场大家做的Coding类产品,实际上解决的是轻量化软件的交付能力。而面对复杂的企业级业务场景,它们很难做到更好。
而这正是我们眼中巨大的市场空间,可能看上去是dirty work,反而成为创业公司的机会。
王伟:资本往往偏好C端Coding产品,因为在大模型时代它像快消品,商业模式简单清晰且易扩张。但你会发现,越平权的技术,或越薄的Agent产品,往往非常依赖信息差和时间差。
现在的情况是Vibe Coding产品层出不穷,但各领风骚几十天。最终结果就是Vibe Coding交付物泛滥,价值快速衰减甚至接近归零。
我们更想去真正有挑战的地方,要去有复杂度壁垒的地方,比如如何通过Coding Agent来交付一套电商系统。这是我们认为真正有价值的场景,也是与C端的根本差异。
《智能涌现》:从产品形态看,InfCode为何选择从插件做起?
杨萍:现在大家习惯使用插件或IDE,但这只是代表现阶段用户习惯用什么样的产品而已,并非最本质的形态,但我们可以用这种形态切入市场,减少用户使用门槛。
我们的IDE还在筹备中,很快就会上线,后续会建立Coding Agent企业级平台。
Coding工具链其实很长,涵盖从编辑器、调试、编译到产物管理及上线服务的全过程。我们认为,整个工具链一定会Agent化。未来我们提供的不再是单一工具,而更像是一堆Agent的集成平台。
《智能涌现》:词元无限的产品开发过程中,你们大概多少代码会用Agent直接写?
王伟:通用类型代码编写占比比较高,大约80%左右。Agent核心代码部分大约50%上下。
目前Agent核心部分是使用rust编写的,由于很多功能属于新设计,现有基模对此类模式缺乏足够预训练知识支撑,所以很多时候需我们自己摸索和实现。
《智能涌现》:你们提到企业上下文管理和业务承载能力,具体如何实现?因为每家企业的infra都不一样,这个挑战其实挺大。
杨萍:这里分几类。第一是偏标准场景,比如文档管理,无论对接飞书文档还是企业OA系统,这都有市占率较高的产品提供服务。
对于这类产品,我们会内置连接器,类似MCP的服务,能将这些产品快速集成。一旦配置完成,我们的Editor在工作时就能直接查询这些信息,服务于整个工作流程,使其更精准。
第二类是Infra和更底层服务,这确实是挑战。因为每家公司的微服务、日志体系、日志等级定义甚至规范都不同,这些东西永远无法被文档穷尽。
我们目前通过提供一整套进程系统,把定义问题和发现问题的能力交给企业自己。我们提供机制,让他们能将自己的非标Infra接入,而不是我们去一家家硬适配。
《智能涌现》:你们现在的产品能达到什么级别研发人员的水平?
杨萍:我们的插件产品瞄准初阶程序员或实习生所能解决的问题。在代码补全/Debugging场景,会进一步面向中阶程序员所能达到的水平。
本质上,我们看的不仅是单纯写代码的部分,写代码只占研发人员可能30%的时间,研发人员还有时间要收集信息、整理任务规划,我们的产品会瞄准这个环节。
过去,研发很难像测试那样量化工作量,但未来我们可以通过Agent来观察。我们很认同红杉提出的RaaS理念,即以结果为服务。
在软件工程领域,这套模式可能最早实现,因为最终解一定是看你给客户创造了多少实打实的价值。
《智能涌现》:早期在字节内部做Marscode,你经历了从对内提供服务到对外提供服务的过程。在这个过程中,你有哪些核心know-how?
杨萍:字节是工程师文化,大家对于技术栈的选择比较自由。因此,沉淀下来的代码资产挖掘难度特别大,我们给自己定的ROI就是不想只做技术,而是要看具体业务价值。
第二个重要发现是,业务方更在意的是你能不能直接讲清楚价值,而非那些抽象的提效概念。比如代码删除,我们会直接计算能给服务器资源带来的减少,折算成节省的钱。这对我们后来看这个赛道非常重要。
《智能涌现》:当时对AI Coding在企业端市场落地,有什么关键判断吗?
王伟:我们认为AI Coding尚未到终局形态。哪怕到现在,这个赛道的高光也都集中在C端市场。那时我们就觉得B端是空间更大的蓝海市场。
我们过去一年一直在思考:如果这件事未来一定会有人能做出来,为什么不是我们?所以,这决定了我们哪怕在2025年,也要坚定出来应对,直接奔着目标去。
《智能涌现》:现在词元无限切入的场景是否有侧重,比如主要侧重Coding部分,还是做debugging?
李莹:在实践中我们发现,直接满足企业业务需求的周期往往很长,仅交付环节就可能需3到6个月甚至更久。若要深入前端理解业务属性,难度更大。
我们会分三个阶段迭代:第一阶段是工具,以轻量化模式嵌入企业内部,辅助完成代码研发交付。从Coding切入,先理解企业的代码库和知识库,进而看企业业务系统,这块可能更好落地,离商业化更近。这也是创业公司擅长的——跑得够快,迭代够快,能更好支撑服务。
第二阶段,我们会变成工具+平台,目前我们正处于第一和第二阶段混合阶段。平台本质上是一个连接器:向下连接新一代AI底层模型能力,向上搭建Agent。它能帮企业更好理解自身业务逻辑与属性,构建底层代码库。
更重要的是,它还能解决企业遗留一二十年、压根未梳理的业务系统,我们管这叫“旧改”——只有先帮企业梳理好这些旧系统,才能支撑更上层应用,这其实是更大的市场空间。
《智能涌现》:现在阿里、字节、百度等大厂都在做Coding Agent,包括Cursor这样的垂类厂商也在做企业版。你们如何看待这些竞争?
杨萍:头部企业的布局未必意味着市场终局。
首先,头部厂商策略往往高举高打,国内早期Coding产品较多聚焦在C端用户运营,如字节、百度等企业的初期动作。真正具备To B属性的产品,如Qoder,直至今年下半年才陆续出现。
其次,许多大厂布局Coding Agent的根本动机,很多并不在于工具本身的产品价值,更多是作为云服务与模型业务的入口策略——比如用极低定价甚至“买云送工具”来牵引客户。这种模式虽可快速获客,但难以真正沉下心构建扎实的产品能力与生态体系。
现在,端到端的AI编程尚未形成明确市场标准与行业共识,我们认为这是一个关键时间窗口,必须加速确立标准,深度打通企业级研发流程。
《智能涌现》:所以你们觉得AI Coding领域的最终态会长什么样?
王伟:若把时间维度拉长,AI Coding会逐步从单体工具进化到人机协作模式,最终演变为程序员群体本身。这种模式意味着现在的生产力主体和组织就变了。
如何加速这个变化的到来,并实现组织的快速升级转型,这是我们认为此事真正的意义。
《智能涌现》:现在投资人最challenge你们的是哪一点?是技术能力、商业化路径还是竞争压力?
杨萍:商业化。
《智能涌现》:上一代AI 1.0时代,很多AI和SaaS公司很多都沦为做大项目、重交付却不赚钱的境地,做AI Coding,如何避免走这条老路?
杨萍:传统SaaS更多是用标准化模块固化解决问题的流程,本质还是单点工具价值。但AI Coding的核心价值是通过N个动态能力组合解决企业复杂问题。这是在推动业务从流程执行走向智能决策与生成,商业定价也会和以前不同。
王伟:我的观点会更乐观。快则两三年,慢则三五年,所谓的“定制化”都会变得唾手可得。
AI Coding与以前的AI模式最大区别在于,它本质上是在创造一种由AI驱动的数字劳动力,规模化扩展、个性化方案与低实施成本的不可能三角,在AI Coding背景下获得了新可能性。
在我们的规划里,未来会产生一种新组织形态——“ISV Agent”。
生产模式类似ISV,但核心在于其管理的生产力对象和机制不同——不再是大量人力,而是由人类直接管理大量高效Agent员工。Agent能力高低,直接决定新组织形态的生产效率。
《智能涌现》:意思是说现在Agent的供给还偏少,所以企业愿意为提供Agent管理服务的厂商付费。
王伟:一是,产品需能提供足够价值,若我们创造的价值不够厚,客户会要求我们做适配,进而失去议价权和竞争优势。
二是,技术会逐步平权,若三五年后大量对手涌入,同质化竞争,客户自然会拿到更多话语权,这是市场博弈的结果。
所以,创业时机很重要。现在To B的AI Coding产品尚未形成市场标准和供需平衡,但又有巨大商业价值,市场存在红利。
封面来源|AI生成
👇🏻 扫码加入「智涌AI交流群」👇🏻
欢迎交流
本文由主机测评网于2026-03-12发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:http://www.vpshk.cn/20260330846.html