从 Claude Code 到成百上千个 Agent:软件开发正在换一种工作方式

本文整理自 YouTube 视频:《Reflecting on a year of Claude Code》,由有道龙虾根据视频字幕自动整理并发布。 一年前,Claude Code 正式开放使用。这个最初诞生于 Anthropic 内部的项目,是一个运行在终端里的 Agentic Coding 工具,如今已经被全球开发者和各类组织用于日常开发。 在这支视频里,Claude Code 负责人 Boris Cherny 和 Claude Code 产品负责人 Cat Wu 回顾了它的第一年:从一个在 Slack 里只收获两个表情反应的内部演示,到工程团队把它部署到整个代码库中。他们聊到了 Agent 验证的最佳实践、Auto Mode 背后的思考、最喜欢的 routines 和 loops、Claude Code 在工程之外的采用、context minimalism 的兴起,以及如何面向 AI 指数级变化构建产品。 Claude Code 刚发布的时候,团队内部的反应其实没那么轰动。 有人把一个小视频发到 Slack,只有两个人点了反应。大家觉得它“挺酷”,尤其是处理一些非常简单的工程任务时,效果还不错。 这句话听起来很委婉。 换句话说,早期的 Claude Code 还远没有今天这么强。 但只过了一年,事情已经完全变了。 现在,使用 Claude Code 的方式不再是“我问一个问题,它给我写一段代码”。很多人已经开始同时运行一批 Agent,甚至是一个 Agent 去调度另一个 Agent,后面再继续调度更多 Agent,形成一棵由成百上千个 Agent 组成的工作树。 软件开发的重心,也从“写代码”变成了“设计任务、让 Agent 执行、验证结果、把经验写进系统”。 真正重要的不是提示词,而是让 Agent 学会改进自己 有一个很关键的经验:...

June 9, 2026 · 2 min · fisherdaddy

到底什么是“循环”?Peter Steinberger 对话 Boris Cherny

本文翻译自 Matt Van Horn 发布在 X 上的文章《WTF Is a Loop? Peter Steinberger vs. Boris Cherny》。本文由有道龙虾翻译、排版和发布。 本周 AI 编程领域被重复最多的一句话只有六个词,而且几乎没人能说清它到底是什么意思。 本周有一条推文让整个时间线都被它“锁喉”,于是我用 /last30days 跑了一遍大家争论的那个词。答案是真实存在的,它有五年的演化脉络,而最讽刺的是:现在真正昂贵的部分不是模型,而是循环。 让整个时间线着迷的那条推文 本周,整个 AI 编程时间线都在围着一条推文转。Peter Steinberger 在 6 月 7 日发了它,浏览量超过 220 万,回复区则变成了一场关于它到底是什么意思的混战。 “这是你每月一次的提醒:你不该再提示编码智能体了。你应该设计那些会提示你智能体的循环。” 这就是所有人都在引用的那句话。最有代表性的回复来自 Varadh Jain,他问了唯一真正重要的问题:这在实践中到底长什么样?而成为全场情绪代表的回答,则来自 Matthew Berman。 “没人知道,除了他和 Boris。” 这才是真正的故事。不是“循环就是未来”,而是一个六个词的短语拿到了 200 万浏览量,同时转发它的人却在回复区争论它到底是什么意思。 我没有翻白眼,因为我自己每晚都跑一个循环,在我睡觉时,它会给大约 30 个开源仓库打开 pull request。90 秒的研究返回了 15 个 Reddit 讨论串、21 条 X 帖子,以及一个令人不太舒服的模式:AI 编程里最响亮的概念,恰恰是大多数复述它的人解释不清的东西。 一派人在喊:提示工程已死。另一派,也就是那些手真的放在键盘上的人,则谨慎得多。 “它不是 ralph/goal 循环,那现在已经是老东西了。它大概是某种持续编排循环,用来监督其他线程/智能体。” 这条回复是所有人发出的答案里最接近正确的一条。先记住它。 循环到底是什么 Boris Cherny 在 2024 年 9 月把 Claude Code 当作副项目做了出来。现在据说,GitHub 上接近 4% 的公开提交都在它背后完成。6 月 2 日,在 WorkOS 主办的 Acquired Unplugged 活动舞台上,他给出了你能找到的最清晰的“循环”定义。...

June 9, 2026 · 3 min · fisherdaddy

在 Claude Code 中推出动态工作流

原文标题:Introducing dynamic workflows in Claude Code 本文完全由有道龙虾自动翻译和发布。 原文链接:https://claude.com/blog/introducing-dynamic-workflows-in-claude-code 今天,我们在 Claude Code 中推出动态工作流,帮助 Claude 端到端处理最具挑战性的任务。过去通常需要按季度规划的工作,现在可以在几天内完成。Claude 会动态编写编排脚本,在单个会话中运行数十到数百个并行子代理,并在任何内容交付给你之前先检查自己的工作。 有些问题太大,无法靠单个代理一次性完成,尤其是在复杂的遗留代码库中:比如跨整个服务追踪 bug、涉及数百个文件的迁移,或者在你决定采用某个方案之前,希望从各个角度对它进行压力测试。动态工作流可以端到端处理所有这些情况。 动态工作流今天已作为研究预览版在 Claude Code CLI、Desktop 和 VS Code 扩展中开放,适用于 Max、Team 和 Enterprise(需管理员启用)计划用户;同时也可通过 Claude API、Amazon Bedrock、Vertex AI 和 Microsoft Foundry 使用。 注意:动态工作流可能比典型的 Claude Code 会话消耗多得多的 token,因此我们建议从一个范围明确的任务开始,先感受它在你工作中的用量情况。 为了获得最佳体验,使用动态工作流时请开启自动模式。之后,你有两种方式可以启动一个工作流: 直接要求 Claude 创建一个动态工作流,例如“Create a workflow”。 打开一个新的 Claude Code 专属设置:ultracode。它可以通过 effort 菜单访问,会将努力级别设为 xhigh,同时让 Claude 自动决定何时使用工作流来处理你的任务。 动态工作流实战 Anthropic 内部的早期访问用户和团队已经在广泛场景中使用动态工作流,包括: 全代码库 bug 搜索、由 profiler 指导的优化审计,以及安全审计: Claude 会并行搜索一个服务或仓库,然后对每个发现运行独立验证,确保报告中浮现的是真实问题。同样的模式也适用于加固工作:在整个代码库中检查认证、输入验证和不安全模式。 大型迁移和现代化改造: Claude 可以端到端处理框架替换、API 废弃迁移,以及跨数千个文件的语言移植。 你需要反复核查的关键工作: 当错误答案代价很高时,一个工作流可以让 Claude 对问题进行独立尝试,并让对抗性代理在你看到结果之前先努力打破它。 用动态工作流重写 Bun 动态工作流在规模化场景中能解锁什么,一个例子是最近对 Bun 的重写。Jarred Sumner 使用动态工作流将 Bun 从 Zig 移植到 Rust,现有测试套件通过率达到 99....

June 4, 2026 · 1 min · fisherdaddy

每个任务都需要一套执行框架:Claude Code 中的动态工作流

原文标题:A harness for every task: dynamic workflows in Claude Code。本文基于 Thariq Shihipar 的原文,完全由有道龙虾自动翻译、整理和发布。 上周,我们在 Claude Code 中发布了 dynamic workflows(动态工作流)。Claude 现在可以根据手头任务,即时编写自己的 harness(执行框架),为当前任务量身定制。 默认的 Claude Code 执行框架是为写代码构建的,但它也适用于许多其他类型的任务,因为很多任务本质上很像编码任务。不过,有些任务类型为了达到最佳效果,我们过去需要在 Claude Code 之上构建自定义执行框架,例如 Research、安全分析、agent 团队或 Code Review。 Workflows 让你可以在 Claude Code 内部原生地动态创建执行框架,让 Claude 解决这些问题以及更多问题。你也可以分享和复用这些 workflows。 本文会介绍我对 workflows 的初步体验和收获,帮助你更充分地使用它。不过,最佳实践仍在发展中。动态 workflows 通常会消耗更多 token,所以要认真思考何时以及如何使用它们。 注:这篇文章也发布在 Claude Blog 上。 示例 Prompt 在深入技术细节之前,我想先给一些示例 prompt,帮你想象 workflows 的可能性: “这个测试大概每 50 次会失败 1 次。搭建一个 workflow 来复现它,提出理论,并在 worktree 里对这些理论进行对抗性测试。/goal 不要停,直到有一个理论成立。” “使用 workflow,查看我最近 50 个 session,挖掘我反复纠正的问题,并把重复出现的内容变成 CLAUDE....

June 4, 2026 · 3 min · Thariq Shihipar

Claude Code 如何在大型代码库中工作:最佳实践以及从哪里开始

本文翻译自 Anthropic 官方博客文章:How Claude Code works in large codebases: Best practices and where to start。本文完全由有道龙虾翻译和发布。 Claude Code 已经在生产环境中服务于数百万行代码的单体仓库(monorepo)、存在数十年的遗留系统、横跨数十个代码仓库的分布式架构,以及拥有数千名开发者的组织。这些环境会带来小型、简单代码库没有的挑战,例如每个子目录的构建命令都不同,或者遗留代码散落在多个文件夹中,没有统一的共享根目录。 本文总结了我们观察到的一些模式,这些模式帮助团队成功地在规模化环境中采用 Claude Code。我们所说的“大型代码库”涵盖很宽的部署范围:数百万行代码的 monorepo、历经数十年构建出的遗留系统、分散在独立仓库中的数十个微服务,或者上述情况的任意组合。这也包括使用某些团队不一定会与 AI 编程工具联系在一起的语言的代码库,例如 C、C++、C#、Java、PHP。(尤其是在近期模型发布之后,Claude Code 在这些场景中的表现通常比多数团队预期得更好。)虽然每个大型代码库部署都会受到具体版本控制系统、团队结构和长期积累的约定影响,但本文中的模式具有普遍适用性,可以作为考虑采用 Claude Code 的团队的良好起点。 Claude Code 如何导航大型代码库 Claude Code 导航代码库的方式类似软件工程师:它遍历文件系统、读取文件、使用 grep 精确查找所需内容,并沿着引用关系在代码库中追踪。它在开发者本机上本地运行,不需要构建、维护代码库索引,也不需要把索引上传到服务器。 基于 RAG(Retrieval-Augmented Generation,检索增强生成)的 AI 编程工具通常会为整个代码库生成嵌入,并在查询时检索相关片段。在大规模环境下,这类系统可能失效,因为嵌入流水线跟不上活跃工程团队的提交速度。等开发者查询索引时,索引反映的可能是数周、数天,甚至数小时前的代码库状态。检索结果可能返回一个团队两周前已经重命名的函数,或者引用上个迭代已经删除的模块,而且没有任何迹象表明这些结果已经过时。 智能体式搜索(agentic search)可以避开这些失效模式。它不需要随着成千上万名工程师不断提交新代码而维护嵌入流水线或集中式索引。每个开发者的实例都直接基于实时的本地代码库工作。 但这种方法也有取舍:只有当 Claude 拥有足够的起始上下文、知道该从哪里开始查找时,它的效果才最好。这意味着 Claude 的导航质量取决于代码库本身的准备程度,包括如何用 CLAUDE.md 文件和技能(skills)分层提供上下文。如果你要求它在十亿行代码库中查找某个模糊模式的所有实例,它可能在真正开始工作之前就碰到上下文窗口限制。愿意投入代码库准备工作的团队,会得到更好的结果。 运行框架与模型同样重要 关于 Claude Code,最常见的误解之一是认为它的能力完全由所使用的模型决定。团队往往关注模型基准测试,以及模型在测试任务上的表现。实践中,围绕模型构建的生态,也就是运行框架(harness,模型周边的上下文、工具和集成层),对 Claude Code 表现的影响往往超过模型本身。 这个运行框架由五类扩展点构成:CLAUDE.md 文件、hooks(钩子)、skills(技能)、plugins(插件)和 MCP servers(MCP 服务器)。它们各自承担不同功能。团队构建它们的顺序也很重要,因为每一层都会建立在前一层之上。另外还有两项能力补齐整体配置:LSP 集成和子智能体(subagents)。下面我们说明这些组件和能力分别做什么。 CLAUDE.md 文件应该最先建立。这些是 Claude 在每个会话开始时自动读取的上下文文件:根目录文件提供整体图景,子目录文件提供局部约定。它们为 Claude 提供完成任何任务所需的代码库知识。由于这些文件会在每个会话中加载,无论任务是什么,因此应只保留广泛适用的内容,避免它们拖慢性能。...

May 19, 2026 · 2 min · fisherdaddy

使用 Claude Code:HTML 不合常理的有效性

本文翻译自 Thariq 在 X 上发布的文章:Using Claude Code: The Unreasonable Effectiveness of HTML。本文完全由有道龙虾翻译和发布。 Markdown 已经成为智能体与我们沟通时最主流的文件格式。它简单、可移植,有一定的富文本能力,也很容易让你编辑。Claude 甚至已经非常擅长在 Markdown 文件里用 ASCII 画图。 但随着智能体变得越来越强,我开始觉得 Markdown 变成了一种限制性格式。超过一百行的 Markdown 文件对我来说就很难读。我想要更丰富的可视化、颜色和图表,而且希望它们能轻松分享。 我也越来越少亲自编辑这些文件,而是把它们当作规格说明、参考文件、头脑风暴结果等来使用。即便我确实要修改,通常也是让 Claude 去改,这就削弱了 Markdown 最大的优势之一。 我已经开始更偏好用 HTML 作为输出格式,而不是 Markdown。我也越来越常看到 Claude Code 团队的其他人这么做。下面是原因。 如果你想先看一些例子,可以看这里:html-effectiveness,但记得回来继续读为什么。 为什么是 HTML? 信息密度 相比 Markdown,HTML 能传达丰富得多的信息。它当然可以表达简单的文档结构,比如标题和格式,但它还可以表示各种其它信息,例如: 用表格表示表格数据 用 CSS 表示设计数据 用 SVG 表示插图 用 script 标签表示代码片段 用 HTML 元素、JavaScript 和 CSS 表示交互 用 SVG 和 HTML 表示工作流 用绝对定位和 canvas 表示空间数据 用 image 标签表示图片 我甚至会说,几乎没有 Claude 能读懂、但你无法用 HTML 相对高效表达的信息集合。这让 HTML 成为模型向你传达深度信息、并让你审阅这些信息的一种非常高效的方式。...

May 11, 2026 · 3 min · fisherdaddy

Claude Code 之父 Boris Cherny:编程正在变成人人都会的基础能力

以下内容完全由 有道龙虾 整理,排版和发布。原视频:Head of Claude Code: What happens after coding is solved | Boris Cherny。 Claude Code 一开始并不是爆款 Claude Code 今天看起来像是突然冒出来的未来工具,但 Boris Cherny 讲得很坦白:它最早几乎是“意外”做出来的。 2024 年底,他加入 Anthropic 内部一个叫 Anthropic Labs 的小团队。这个团队像一个孵化器,人数不多,却做出了几件后来影响很大的东西:Claude Code、MCP,还有 Claude 桌面应用。 Claude Code 的起点,是团队看到了一种“产品悬空”状态。模型已经有能力做很多事,但还没有一个产品把这些能力接住。 当时写代码的主流 AI 体验还是自动补全:打开 IDE,按 Tab,一行一行补。Sonnet 3.5 已经让这种体验变得好用,但 Boris 和团队觉得,这不是终点。 他们想做的不是“帮你补下一行”,而是让 agent 直接写完整代码。 问题是,最开始真的不好用。 Boris 说,前 6 个月 Claude Code 基本没跑起来。他自己大概只有 10% 的代码会用它写。早期发布后也没有立刻爆发,虽然有人用,但远远不是今天这种增长曲线。 真正的转折点出现在 Opus 4 发布之后。Claude Code 的增长从那时开始明显加速,之后每一次模型升级,增长都会再拐一次弯。从 Opus 4,到 4.5、4.6,再到 4.7,产品能力几乎是跟着模型能力一起往前跳。 这也是 Claude Code 很特别的一点:它不是为当时的模型做的产品,而是提前半年为下一代模型做的产品。...

May 7, 2026 · 2 min · fisherdaddy

AI 时代的产品经理,真正稀缺的不是写代码,而是知道该写什么

本文整理自 YouTube 频道 Lenny’s Podcast 的访谈视频 How Anthropic’s product team moves faster than anyone else | Cat Wu (Head of Product, Claude Code),由有道龙虾总结和发布。 如果你还在用半年、一年为单位规划 AI 产品,可能已经慢了。 Anthropic 的 Claude Code 和 Co-work 团队,现在很多产品功能的周期已经从过去的 6 个月,压缩到 1 个月、1 周,甚至有时候是 1 天。 这不是因为他们找到了某个神奇流程,也不只是因为他们能用最前沿的模型。更核心的变化是:AI 正在把“写代码”这件事变便宜,把真正贵的东西推到台前。 那就是:判断该写什么,为什么写,写成什么样。 这也是 Cat Woo 在这次访谈里反复强调的主线。她是 Anthropic 负责 Claude Code 和 Co-work 的产品负责人,和 Boris 一起站在 AI 原生产品构建的最前线。她看到的变化很直接:PM 的角色没有消失,但它正在被重新定义。 PM 的工作,不再是守着路线图开会 Cat Woo 对自己和 Boris 的分工有一个很有意思的描述。 Boris 更像技术负责人和产品愿景提出者,能看到 3 个月、6 个月之后产品该长成什么样,甚至是“AGI pilled”版本的产品该是什么样。...

May 7, 2026 · 4 min · fisherdaddy

10 个适合初学者的 Claude Code 构建创意(附完整提示词)

本文翻译自 X 博主 Zara Zhang 发布的文章:10 beginner-friendly ideas to build with Claude Code (Prompts included)。 只要你会打字,就能用 Claude Code 进行构建。 1. 将你的简历变成个人网站 这里有 10 个让你入门的想法。无需任何技术背景。我已附上了你可以直接使用的具体提示词。 把你的简历投喂给 Claude Code,让它为你构建一个精美的作品集网站。想要特定的外观?先在网上找一些视觉参考,然后让它匹配那种风格。 “这是我的简历 [附上文件]。请为我构建一个干净、现代的个人网站,展示我的经验和项目。我喜欢这个 [参考链接] 的视觉风格。试着匹配这种美学。我完全没有编程经验,所以请一步步指导我。” (要附加文件,只需将其拖入与 Claude Code 的聊天窗口即可。) 2. 构建一个用于语言学习的浏览器扩展程序 创建一个扩展程序,让你可以在外语网站上高亮文本,根据上下文获取 AI 驱动的释义,并将单词保存到你自己的词汇表中。 “为我构建一个语言学习用的浏览器扩展。当我在任何网页上高亮文本时,它应该根据周围的上下文显示 AI 生成的解释,并让我把单词保存到个人词汇表中。我不懂代码。请给我简单、按部就班的说明,告诉我所有需要做的事情。” 3. 基于你的健康数据创建一个习惯追踪器 上传你的体检报告,让 Claude Code 根据结果为你构建一个个性化的习惯追踪和打卡应用。 “这是我最近的体检报告 [附上文件]。根据结果,为我构建一个简单的日常习惯追踪应用,帮助我改善需要关注的领域。包含一个连胜(streak)功能来帮我坚持下去。用大白话解释所有内容。我不是开发人员。” 4. 整理你杂乱的文件夹 桌面或下载文件夹乱糟糟的?直接让 Claude Code 来整理。真的,只要告诉它你想要什么,然后让它去干活。 “我的下载文件夹一团糟。检查一遍,根据文件类型和内容将文件整理到合理的子文件夹中。在移动任何东西之前,先把你的计划展示给我看并征求我的同意。我不懂技术,所以解释要简单点。” 5. 转录您的会议录音 把你的会议音频或视频文件丢进一个文件夹。Claude Code 可以使用 OpenAI Whisper(本地运行且免费!)转录它们,清理错误,并标记发言人。 “我在 [文件夹路径] 有一个会议录音文件夹。使用 OpenAI Whisper 将每个文件转录为文本。清理明显的错误,并在能区分不同人的地方加上发言人标签。将每个转录保存为单独的文档。一步步指导我完成所有需要的设置。我是个纯新手。”...

January 26, 2026 · 1 min · fisherdaddy

Claude Code 进阶教程:详解 Skills、Subagents 与 MCP 高级用法 • Eyad

Varick Agents CTO Eyad Khrais 吃到上一篇 Claude Code 入门文章:The complete claude code tutorial 的红利后(在 X 上大受欢迎,总阅读量接近 500 万),又迅速写了第二篇 Claude Code 进阶的文章:The claude code tutorial level 2。这篇文章的核心在于介绍 Skills(技能)、Subagents(子智能体)和 MCP connectors(MCP 连接器)这三大高级功能。 关键细节 Skills(技能):教导 Claude 特定工作流 定义与结构:Skill 是一个 Markdown 文件,包含 YAML 头信息(名称、描述)和具体的指令正文。 创建方式:在 ~/.claude/skills/ 目录下创建文件夹和 SKILL.md 文件。 工作原理:采用“渐进式披露”原则。Claude 启动时仅加载 Skill 的名称和描述(约 100 tokens),只有在判定相关时才加载完整指令。这允许用户拥有数十个技能而不占用过多上下文。 应用场景:代码审查标准、Git 提交信息规范(如 Conventional Commits)、数据库查询模式、API 文档格式等。 Subagents(子智能体):隔离上下文与任务分发 核心优势:解决上下文退化问题。主对话将复杂任务委托给子智能体,子智能体在独立的 200K 窗口中运行,仅返回摘要给主对话,从而防止主上下文被污染。 内置类型: Explore:快速、只读的代码库搜索与分析。 Plan:用于规划模式下的研究和架构决策。 General-purpose:处理需要多步操作的复杂任务。 自定义智能体:用户可在 ~/.claude/agents/ 中定义自定义智能体(如安全审查员),设定特定的系统提示词和工具权限(如只读或读写)。 通信模式:主智能体委托任务 -> 子智能体执行 -> 子智能体返回摘要。注意:子智能体不能再生成子智能体。 MCP Connectors(模型上下文协议):连接外部世界 功能:一种标准化的接口,允许 AI 模型直接调用外部工具和数据源,无需为每个工具单独集成。 操作命令:使用 claude mcp add --transport http <name> <url> 添加连接。 推荐集成: GitHub:管理代码库、PR 和 Issue。 Slack:读取频道历史和摘要。 PostgreSQL:直接查询数据库。 Linear/Jira:集成任务跟踪。 实际效果:将原本需要切换 5 个标签页(查看 Issue、设计图、Slack 讨论、写代码、更新工单)的工作流,整合为一个连续的会话。 原文:The claude code tutorial level 2 这是官方 Claude Code 教程的第二部分,我将涵盖更高级的概念,帮助你更充分地利用 Claude Code。如果你还没读过第一部分,我强烈建议你在读这篇文章之前先读一下。这篇文章直接建立在那些基础之上。...

January 14, 2026 · 3 min · fisherdaddy