实战:用 7 个 Agent 将 Vibe Coding 升级为专家级开发流程

把单一 AI 对话拆成 7 个专责 Agent,每个只拥有单一职责、干净的上下文与严格边界——从”凭感觉写代码”升级为结构化的软件工厂

基本信息

核心观点

  1. Vibe Coding 有结构性天花板:当你要求一个 AI 对话同时扮演产品分析师、架构师、后端工程师、前端工程师、测试工程师、代码审查员时,错误会在一个混乱的对话里累积——“第 1 天像魔法,第 30 天你花在监督 AI 的时间比自己写代码还多”。本质不是 AI 在失败,是工作流在失败
  2. 7 Agent 软件工厂的核心是职责分离:研究员(只读探索代码库)→ 故事撰写者(定义用户故事)→ 规格撰写者(技术简报)→ 后端建造者(API+服务+单测)→ 前端建造者(UI+组件+测试)→ 测试验证者(验收测试)→ 验证员(对照简报报告差距),每个 Agent 有自己干净的上下文窗口和严格的操作边界
  3. 3 个人类审核点是质量保险:核准故事(Human Review Point 1)、核准技术简报(Human Review Point 2)、核准 PR(Human Review Point 3),其他环节全部自动运行。人类被从”不需要判断力的部分”踢出去,专注于”对的问题、对的设计、能不能安全上线”
  4. 上下文漂移是 AI 编程的无声杀手:一个错误假设进入上下文后模型会继续往上叠加,导致错误扩散。正确做法:架构假设错了就丢掉整个对话重新开始,“一个有正确心智模型的干净对话永远胜过一个打了补丁的对话”
  5. CLAUDE.md 是软件工厂的记忆基础设施:100-300 行的项目规范文件,每次 AI 犯错就加一条规则,几周后变成”AI 曾经弄错的所有假设”的记录。配合 7 Agent 的权限隔离(研究员只有 Read/Grep/Glob、建造者只限自己的文件夹),构成工厂运转的制度基础

实操内容保留

操作步骤(8 步设置清单)

  1. 安装 Claude Code → code.claude.com
  2. 建立资料夹结构:.claude/agents/ / .claude/skills/feature-factory/ / .claude/skills/build-with-tests/ / .claude/hooks/
  3. 写你的 CLAUDE.md(100–300 行:技术栈、指令、架构规则、不要做的清单)
  4. 用 Claude Code 的 /agents 指令建立 7 个 Agent。描述每个 Agent 的角色。Claude 写文件。你审查并 commit
  5. 建立 feature-factory orchestrator skill。叫 Claude 帮你写——它会读你 7 个 agent 文件并接好整条链
  6. 建立 build-with-tests skill。描述你的团队怎么建造:对齐既有模式、边写代码边写测试、最后跑 typecheck
  7. 加一个 pre-commit hook。挡住把 .env.key.pemsecrets.json 提交进去
  8. 跑一个真实的功能走完整条链。挑一个小的。观察它在哪里卡住。加规则。工厂会自己调整

总时间:2–3 小时。 3–4 个功能后工厂就认识你的代码库了。

7 Agent 权限速查

Agent工具权限操作边界
研究员(Researcher)Read、Grep、Glob只读,不能编辑任何文件
故事撰写者(Story Writer)Read只读,产出用户故事后等人类核准
规格撰写者(Spec Writer)Read、Grep、Glob只读,产出技术简报后等人类核准
后端建造者(Backend Builder)Read、Edit、Write、Bash只限后端文件夹
前端建造者(Frontend Builder)Read、Edit、Write、Bash只限前端文件夹
测试验证者(Test Verifier)Read、Edit、Write、Bash只限测试文件
验证员(Validator)Read、Grep、Glob只读,只报告不修复

关键概念

  • Vibe Coding — 本文指出其结构性天花板,提出 7 Agent 软件工厂作为升级方案
  • Claude Code — 软件工厂的运行载体,通过 /agents 指令和 .claude/agents/ 目录实现多 Agent 分工
  • 上下文工程 — 上下文漂移是软件工厂要解决的核心问题之一
  • 7 Agent 软件工厂 — 本文核心概念,从 Vibe Coding 升级到结构化多 Agent 开发
  • 上下文漂移 — AI 编程中错误假设在对话中累积的无声失败模式

与其他素材的关联

  • 2026-05-29-woshipm-shawn-abu-claude-code-6-weeks 的关系:Shawn 用 6 周 62,376 次对话验证了 Vibe Coding 的上限,本文提供了从 Vibe Coding 突破天花板的具体方法论——7 Agent 分工取代单一对话
  • 2026-05-27-pm-vibe-coding-5-products 的关系:Iris 验证了 Vibe Coding 的可行性,本文提出了 Vibe Coding 失效时的升级路径——当项目复杂度超过单一 AI 对话的承载力时,需要引入 Agent 分工
  • 2026-05-28-woshipm-ai-workshop-multi-agent-collaboration 的关系:AI Workshop 解决多 Agent 共享工作场的问题,本文解决多 Agent 的职责分离和工具权限隔离问题,两者互补
  • 2026-05-28-agents-md-coding-standard 的关系:AGENTS.md 是项目规范文件,本文把 CLAUDE.md 定位为 7 Agent 工厂的制度基础——每个 Agent 都读 CLAUDE.md,但每个 Agent 只拥有自己职责范围内的工具权限

原文精彩摘录

第 1 天:这像魔法。第 30 天:你花在监督 AI 的时间,比过去自己写程式还多。 同样的逻辑出现在三个不同的地方。Claude 忘了你两周前订下的惯例。新功能弄坏旧功能。测试不是缺少就是写得很浅。你某天醒来才意识到:不是 AI 在失败,是你的工作流在失败。

修正之道,是把工作拆给专门化的代理人。 每一个代理人会得到:→ 一个聚焦的工作 → 自己干净的上下文窗口 → 只拥有它真正需要的工具 → 对它「不可碰触的范围」有严格规则。结果:一座软件工厂。 一个开发者 + 七个聚焦的代理人 = 一支协调的团队。

上下文漂移——那个无声的杀手。 大部分 Claude Code 对话不会戏剧性地失败。它们会漂移。 一个错的假设进入上下文。模型继续往上面叠。规则: 小错字?直接 inline 修正。架构假设错了?把整个对话丢掉,从头开始,把对的假设烙进第一个 prompt。一个有正确心智模型的干净对话,永远胜过一个打了补丁的对话。

工厂不是把你从流程里踢出去。它是把你从「不需要你判断」的部分里踢出去。 你会留在那些「你的判断真正重要」的环节里:这是对的问题吗?这是对的设计吗?这个可以安全上线吗?中间的所有事情,Agent 负责。这就是「把 AI 当成更快的键盘」和「把 AI 当成一支协调团队」的差别。

相关页面