探索硅谷程序员如何利用AI编程,发现被2000家公司采用的AI代码审查智能体Greptile,基于每月十亿行代码的审核数据,发布了AI编程年度报告,揭示了AI编程带来的生产率飞跃,但程序员对此感受不一。
报告的核心亮点在于,AI编程的助力下,工程师的代码产出量实现了惊人增长。
每位开发人员每月提交的代码行数从4450激增到7839,增幅高达76%。对于规模在6-15人的中型开发团队,每位开发者的代码提交量更是近乎翻倍(提升89%),这标志着AI编程工具正成为效率倍增器。
更为引人注目的是,程序员单次提交代码时,每文件中变更的代码行数的中位数上升了20%(从18变至22行),这暗示代码迭代不仅「加速」,而且「变化更多」,可能反映了AI编程工具能够处理的代码及应对的需求正变得更加复杂。
然而,对于报告中提及的效率提升,在ycombinator论坛上的讨论却充满怀疑。有人认为修复AI生成代码中的问题需耗费大量时间。
这些细微差异从未被这类指标捕捉。更多人讨论的是,提交代码数量的增加是否等同于程序员真实工作效率的提升。
新手程序员完成一个功能可能需要几十行代码,而资深程序员则寥寥数行即可。此外,引入AI编程后,代码被删除和重写的频率如何?这虽不易统计,却能反映AI编程对工作效率的真实影响。
另一种观点是,代码提交数量的增加并不等同于工作效率提升。假设员工专业能力相同,生产力应取决于代码行数的产出。但实际上,复杂任务可能不需多行代码,仅资深程序员能完成;简单任务却需大量代码。仅看代码提交量,是将所有任务视为中等难度。
此外,不同程序员提交的代码质量各异,这一点在报告中未体现。从这个角度看,每行代码都是负担而非资产。开发团队需领域专家判断所需代码行数。
就像通过每小时搬运物品数量衡量仓库员工生产力。若有人随意堆放或搬运无需移动之物,将最大化这一指标。
AI辅助下每位程序员能生成更多代码,但这些代码是否必要?这非业务方考虑的问题。仅衡量提交代码数可能鼓励不必要的重复劳动。
因此,「编辑行数」或成评估程序员工作效率的更合适指标。通过重构减少代码库规模仍被视为有生产力。每删除或添加一行代码均得1分。
效率跃升背后是技术栈的激烈重构。报告以不同大模型提供商的SDK下载量为考察变量,发现mem0在AI记忆模块中占据59%市场份额;对比向量数据库则呈现「六强混战」(Weaviate 25%领先,Chroma/Pinecone/Qdrant等紧咬)。
LLMOps层方面,LiteLLM增长4倍至4100万下载,LangSmith凭借LangChain生态捆绑上位。这反映一个趋势:模型调度、监控、降级已从「可选项」变为「基建标配」。
随着编程调用的智能体数量增多,运维复杂度激增,LLMOps正扮演当年K8s之于微服务的角色。
关于模型间的竞争,报告考察模型提供商从2022年1月至2025年11月的SDK下载量,主要玩家包括OpenAI、Anthropic和Google GenAI。OpenAI以一条陡峭上升的绿色曲线主导市场。其下载量从2022年初的几乎为零,一路飙升至2025年11月的1.3亿次,确立了市场领导地位。
Anthropic(红色折线)增长轨迹堪称「火箭式」。
虽然起步较晚且基数较小,但自2023年下半年开始,其下载量呈指数级爆发。到2025年11月已达到4300万次,实现了自2023年4月以来1547倍的惊人增长。Open AI和Anthropic的比值已从47:1缩至4.2:1——开发者正转向更开放、更可控、更可编程的接口。
而谷歌(黄色曲线)增长相对平缓,在2025年11月的下载量约为1360万次,与前两者存在显著差距。
报告还揭示了五大主流模型作为编码智能体后端的实测基准(考察指标包括首个token出现时间、吞吐量、成本等),见下表。
通过该表可见,Claude Sonnet 4.5与Opus 4.5仅需不到2.5秒即可返回首个token,显著优于GPT-5系(>5秒)。在交互式编程中,2秒是「心流」与「分心」的临界阈值。
而在批量生成场景中,GPT-5-Codex与GPT-5.1的吞吐量领先,适合后台CI/CD流水线中的大规模代码生成/测试用例填充。
Gemini 3 Pro在响应速度上显著较慢,需等待超过10秒返回首个token,每秒输出的token数也较少,不适合交互式编程场景。
报告最后部分还列出了2025年基础模型及大模型编程应用领域的关键论文,预示了下一波突破方向。例如Self-MoA颠覆传统多模型集成;Search-R1用强化学习训练模型「自主决定何时搜索」,将搜索引擎变为可学习的环境动作;RetroLM在KV层面检索,绕过原始文本。
无论多少AI辅助编程工具被使用,提交代码前仍需人工审查。追踪AI编程工具的使用数据无法涵盖人工审核部分,难以真实反映产品体验及效果。但若能证明AI编程工具有助于更快发布功能而非仅通过更多代码行数审查,则更具可证明价值。
本文由主机测评网于2026-06-09发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260647783.html