未来软件开发的新模式:无需人类编写和审查代码,软件照样能高效交付?
2026年2月,一家专注于基础设施安全的公司StrongDM,公开了一套“软件黑灯工厂”式的生产线成果,让人眼前一亮。
在这个高度自动化的生产线中,人类不再直接参与代码编写和审查工作;开发流程转变为“将spec和场景输入系统”,随后由Agent自动生成代码、运行测试/评测,并在反馈中反复迭代,直至结果收敛、达到可交付标准。团队的核心原则简洁有力——No hand-coded software。
更令人瞩目的是,StrongDM还开源了他们的核心项目:
一个仓库是:https://github.com/strongdm/attractor
这是他们“软件工厂”体系中最核心的非交互式编码Agent。但此仓库并无一行代码,仅包含三份详尽描述软件规格的Markdown文件,以及一句提示——将这些规格交给编码Agent执行即可。
另一个仓库:https://github.com/strongdm/cxdb
这个仓库更接近传统软件发布,包含1.6万行Rust、9500行Go和6700行TypeScript。这是他们的“AI Context Store”——一个用于存储对话历史和工具输出的系统,数据以不可变DAG形式组织。
在Hacker News的讨论中,有开发者尝试运行了这一流程,并发现严格按照StrongDM提供的规范,使用Claude基于spec构建的应用,整体质量明显优于自由模型生成的结果。这得益于详尽的规格说明:约6000–7000行的spec覆盖了行为约束、接口语义及系统边界。
当然,这次开源并非完美之作。代码一经发布,便有开发者指出疑似bug、Rust反模式等问题。StrongDM团队回应称,这些项目“是最近几天才决定开源的”,尚未经过充分优化,并已安排继续改进。
沃顿商学院研究AI与组织变革的教授Ethan Mollick转发此内容时表示,这是一次“真正激进的软件开发方式”,需要重新设计流程而非仅将AI塞进旧流程。
在他看来,真正的进步在于围绕AI重做流程,而非仅“多加一点AI”。
StrongDM专注于基础设施访问与身份安全,其核心是管理人类与非人类身份如何安全连接到数据库、云资源等。其AI团队成立于半年前,于2025年7月14日正式成立。
新团队第一天的工作不是写代码,而是制定章程。团队成立的第一小时便明确了必须遵守的约束条件:
代码不得由人类编写。
代码不得由人类审查。
如果每位人类工程师的token成本不到1000美元,则软件工厂还有改进空间。
这一决定并非一时冲动,其背景可追溯到2024年末。随着Claude 3.5的发布,团队观察到在长时序的Agentic编程任务中,结果开始叠加正确性而非错误。
在StrongDM的博客中,他们写道,结合YOLO模式,Anthropic的更新模型首次展现出“非交互式开发”或“成长型软件”的雏形。
在这样的背景下,新团队确立了极端的实验前提:不允许任何手写代码。在2025年7月,这听起来依然相当激进。
规则落地后,问题也随之而来:如何确保无手写代码的系统能正常运行?StrongDM的答案受到场景测试(Scenario Testing)的启发,他们重新定义了“场景”一词,用以表示端到端的“用户故事”。
这些场景通常存放在代码库之外(类似模型训练中的“留出集”),既能被LLM直观理解,又可灵活验证。
“满意度”被用来量化验证结果:在所有场景中观察到的执行轨迹里,有多大比例可能令用户满意?这一设计模拟了传统软件工程中的强力端到端测试。
在StrongDM的软件工厂里,spec不仅是设计说明书,更是系统启动、纠偏和收敛的核心输入。
在传统开发中,spec更多是“对齐工具”,而在StrongDM的设定下,当“人不写代码、人不看代码”成为前提,spec的角色被彻底前移——它不再是参考材料,而是控制面。
“系统能从层层递进的自然语言规范中生长”,并且“不对源代码做语义检查”。在这种设定下,“验收”本身也被重写:spec与场景一起构成评测基准,模型生成的行为是否符合规范,不是靠人去读代码判断,而是看它在这些场景中跑出来的结果是否持续满足预期。
尽管令人惊艳,但此次实验也暴露出无法回避的问题:成本。
有开发者反馈称,按照StrongDM提供的spec使用Claude构建应用时,TypeScript路线的token消耗极高。甚至有开发者计划改用Rust或Go再试一次,以降低成本。
本文由主机测评网于2026-04-11发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260435635.html