要真实评估模型或产品的性能提升,最直接的方法就是投入一整天的工作中实际使用它。
最近,Anthropic宣布完成一轮130亿美元的融资,公司估值达到1830亿美元,这一融资额仅次于2025年3月OpenAI的历史性400亿美元融资。
与此同时,该公司也面临新的考验:许多用户发现其王牌产品Claude Code存在智能下降的问题,部分开发者已经转向OpenAI推出的竞品Codex Cli。
如果不考虑近期的这些争议,Claude Code实际上是一款非常成功的产品。它在发布后四个月内就获得了11.5万用户,并从Cursor那里吸引了大量用户。
这个产品为何能取得如此成就?在最近的一次访谈中,Claude Code负责人Boris Cherny分享了产品构建的关键细节,包括极致易用和高度可扩展的设计理念、以真实体验而非基准测试为核心的评估标准,以及极速响应的用户反馈机制。
视频链接:https://www.youtube.com/watch?v=iF9iV4xponk
以下是详细内容:
1、过去一年中,编程领域经历了哪些重大变革?
一年前,编程工作流通常依赖于集成开发环境(IDE)中的基础自动补全功能,并结合对话式AI进行代码片段的复制粘贴。
如今,智能体已成为编程工作流的核心组成部分。它们不再仅仅是实验性工具或原型,而是深度融入了开发者的日常工作中。
这意味着我们从手动复制粘贴代码、进行针对性编辑,转向了一种更加“放手”的模式——开发者只需向智能体下达指令,信任它执行大量代码修改甚至独立完成整个应用开发。
2、这种转变背后的驱动因素是什么?
此前的主要限制因素有两个:一是模型能力不足,二是模型之上的工具生态不完善。
过去一年,模型在智能体编程方面取得了显著进步,这体现在Sonnet 3.7、Sonnet 4和Opus 4.1等版本中。
同时,工具也大幅改进,例如Claude Code。模型与工具的关系好比马与马鞍:合适的工具能极大释放模型的潜力。
模型是API背后的核心,而Claude Code集成了系统提示、上下文管理、工具调用、MCP服务器连接、权限控制等多种功能。模型接收的所有上下文和工具输出都会深刻影响其最终表现。
过去一年,我们深入理解了如何为模型构建高效工具。模型不仅与Claude Code共同进化,还与整个基于Anthropic模型的智能体编程工具生态协同发展。
3、所谓的“共同进化”是如何实现的?
在Anthropic,所有员工都使用Claude Code,包括模型研究人员。通过日常使用,他们能直观感受到模型的局限性。
例如,使用Sonnet 3.5时,模型只能持续运行约1分钟而不偏离轨道。而新模型能够自主运行的时间越来越长。这是一个基于真实体验的改进循环:作为使用者,你能看到人类需要在何处纠正和引导模型,从而将这些经验融入模型训练中,教会它更好地自主完成任务。
4、评估新模型或新功能时,如何判断性能是否真正提升?
答案很简单:将其用于当天的实际工作。
日常工作涵盖写新代码、修复bug、阅读Slack消息或GitHub问题以回馈反馈等多种任务。
某种意义上,最接近真实场景的评估就是最好的评估。直接上手使用能提供最可靠的信号。
坦白说,构建评估体系非常困难。迄今为止,最直接、最强烈的信号就是主观感受,因为你使用它的任务范围极其广泛。
5、在收集用户反馈方面,你们做了哪些特别努力?
关键在于超快速响应——每当有人提交反馈,我们都会尽快尝试修复。
有时我进入办公室后,会花两三个小时尽可能多地处理并修复bug,修复后立即通知提交者。这鼓励他们持续提供反馈。
直到今天,内部Claude Code反馈通道依然像“消防水带”一样,反馈流源源不断。这种活跃的反馈循环是产品快速迭代的重要基石。
6、Claude Code的当前状态如何?最新功能是什么?你对什么感到兴奋?你看到用户现在用它做什么?
Claude Code的设计哲学是:极致易用和高度可扩展。其中,可扩展性是当前最令人兴奋的发展方向。
扩展能力的演进历程:
最初:通过CLAUDE.md文件添加项目上下文信息
现在:拥有复杂的设置系统、权限管理、Hooks系统、MCP集成、斜杠命令、子智能体等丰富的扩展点
这些功能都与模型能力的整体提升相辅相成:模型变得更加自主、工作时间更长、指令执行更准确、记忆能力更强,所有扩展功能都从中受益。
7、未来6到12个月,使用Claude Code工作会变成怎样的体验?
工作模式将呈现手动与自动的深度融合:
交互式编程:不再是直接修改文本,而是通过Claude操作代码
主动化编程:Claude主动执行任务甚至自我审查,开发者主要负责决策是否采纳修改
目标导向编程:未来12-24个月,Claude将更关注高层目标和整体规划,而非具体执行细节
这类似于工程师的工作方式:先制定月度目标,然后通过一系列小改动逐步实现。Claude也将具备这种宏观规划能力。
8、对需要适应这些变化的开发者,你有什么建议?他们应该学习或发展哪些技能?
在智能体编程出现之前,技术栈极其复杂。想做一个JavaScript网站,必须学习React、Next.js,以及多套构建和部署系统,门槛高得令人却步。
智能体的出现正在改变这一切。如今,有了编程智能体,启动项目变得真正简单。如果你有想法,可以直接去构建它。重点从“如何实现”转向“实现什么”,因为代码可以反复重写。代码本身不再珍贵——当然,编写代码仍是一门艺术,有时你仍会享受手工编码的乐趣,但更多时候,关注点在于你要创造的东西,而非创造过程。
因此,我对今天学习编程的人的建议是:你仍需掌握核心技能——编程语言、编译器、运行时、Web应用开发、系统设计等基础知识不能丢。但同时,你要变得更有创造性。如果你有创业想法或产品构思,现在就可以立即开始构建,这种方式在以前是完全不可能的。我们还无法完全理解这意味着什么,但可以肯定,由于智能体的出现,巨大的创造潜力即将释放。
9、针对使用Claude Code的新手,有哪些实用建议?
第一个建议:先问问题,后写代码。
初次使用Claude Code时,不要急于让它编写代码。先用它理解现有代码库,例如询问:“如果要添加新的日志功能,应该怎么做?”“这个函数为何这样设计?”
让Claude Code探索代码库、查看Git历史并回答疑问。等你熟悉这种“智能体研究助手”模式后,再开始让它编写代码。
第二个建议:根据任务难度选择不同策略。
将任务分为三个等级:
简单任务:一个提示就能完成的工作。直接在GitHub issue中@Claude,让它创建PR。
中等任务:使用Shift+Tab进入计划模式,先与Claude制定执行计划,确认后切换到自动执行模式。
困难任务:开发者主导,Claude辅助。使用Claude进行代码研究、原型验证、边界探索,但核心实现仍由人完成。
关键是根据任务复杂度选择合适的协作模式,而非一刀切使用同一种方法。
本文由主机测评网于2025-12-28发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20251213504.html