如何验证模型和产品性能的真实提升?唯有通过实际工作的检验。
Anthropic公司最近完成了130亿美元的融资,公司估值达到了惊人的1830亿美元,这一数字仅次于2025年3月OpenAI获得的400亿美元融资。
然而,这家公司在赢得赞誉的同时,也面临着新的挑战:其明星产品Claude Code被用户发现存在性能下降的问题,部分开发者已经开始转向OpenAI推出的Codex Cli。
抛开这些争议,Claude Code其实是一款非常成功的产品。它在发布仅仅4个月后就吸引了11.5万用户,从Cursor那里抢占了大量市场份额。
那么,这款产品为何能取得如此成功呢?在最近的一次采访中,Claude Code的负责人Boris Cherny透露了他们构建该产品时的一些关键细节,包括极其简易和高度可扩展的产品理念,以真实体验优先的评估标准,以及极其快速的反馈机制。
视频链接:点击这里查看
以下是详细内容:
1、过去12个月,编程领域发生了什么变化?
一年前,编写代码时你需要一个IDE,其中带有某种自动补全功能,还要借助一些对话式AI,你可能需要复制粘贴代码来完成工作。
现在,智能体已经成为编程工作流的核心组成部分。它们不再是实验性的噱头或原型工具,而是真正融入了开发者的日常工作。
这意味着,我们从复制粘贴代码、进行有针对性的编辑,转变为更加「放手」的方式——告诉智能体你想要它做什么,然后信任它执行大量的代码修改,甚至独立完成整个应用的开发。
2、这种转变背后的原因是什么?
之前的限制因素主要有两个:一是模型不够好,二是模型之上的工具不够好。
过去一年,模型在智能体编程方面取得了显著进步,这得益于Sonnet 3.7、Sonnet 4和Opus 4.1的发布。
同时,工具也取得了很大进步。这里指的是Claude Code。模型和工具的关系就像马和马鞍,马鞍能让你更好地驾驭马(模型)。
模型是API背后的东西。Claude Code集成了系统提示、上下文管理、工具调用、MCP服务器连接、权限控制等功能。所有接收到的上下文信息和工具输出都会显著影响模型的表现。
3、如何实现「共同进化」?
在Anthropic,每个人都在使用Claude Code,包括构建模型的研究人员。他们会看到模型的自然限制。
之前用Sonnet 3.5时,模型可以持续运行大约1分钟而不偏离轨道。现在,新模型可以持续自主运行更长时间。这是一个基于真实体验的改进循环。因为你是模型的使用者,你能看到人类必须在哪里纠正和引导它。我们可以将这些经验融入模型中,教它更好地自己完成这些事情。
4、如何评估新模型和新功能的性能是否改善?
答案很简单:用它做当天的工作。
在日常工作中,你会做各种各样的事情,包括写新代码、修复bug、阅读Slack消息或GitHub问题来回应反馈。
最好的评估是最像真实生活的评估。直接上手使用会给你最好的结果。
5、在收集反馈方面有什么特别之处?
关键在于超快速响应——每当有人给出反馈时,我们都会尽快尝试修复。
有时我会进入办公室,花两三个小时尽可能快地处理尽可能多的bug并修复它们。修复后立即回复大家已解决。这鼓励他们继续给出反馈。
6、Claude Code当前状态如何?最新功能是什么?你对什么感到兴奋?
Claude Code的设计哲学是:极简易用和高度可扩展。其中,可扩展性是当前最令人兴奋的发展方向。
7、未来6到12个月,使用Claude Code工作会变成一种怎样的体验?
工作模式将呈现手动与自动的深度融合:
8、对需要适应这些变化的开发者们有什么建议吗?
智能体的出现正在改变一切。现在,有了编程智能体,开始一个项目变得真正容易。如果你有想法,就可以直接去构建它。重点从「如何实现」转向了「实现什么」。
9、针对使用Claude Code的新手有哪些建议?
本文由主机测评网于2026-04-27发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260440707.html