7 Agent 软件工厂
把单一 AI 对话拆成 7 个专责 Agent,每个拥有单一职责、干净上下文和严格工具权限边界——从 Vibe Coding 升级到结构化多 Agent 开发的方法论
简介
7 Agent 软件工厂是 @sairahul1 提出的 Claude Code 多 Agent 开发方法论,核心理念是:当你在单个 AI 对话里要求它同时扮演产品分析师、架构师、后端工程师、前端工程师、测试工程师和代码审查员时,错误会在混乱的对话中累积——“第 1 天像魔法,第 30 天你花在监督 AI 的时间比自己写代码还多”。
软件工厂把工作拆给 7 个专门化 Agent,每个 Agent 只拥有自己需要的工具权限和操作边界,从而实现:干净的上下文窗口(每个 Agent 只装它需要的信息)、严格的职责隔离(后端 Agent 永远不会碰前端代码)、人类审核点前置(错误在”技术简报核准”阶段就被捕获,而不是 10 个文件被改完之后)。
这是 Vibe Coding 方法论在项目复杂度超过单一 AI 对话承载力时的升级路径。
核心特征
七 Agent 架构
| Agent | 职责 | 工具权限 | 操作边界 |
|---|---|---|---|
| 1. 研究员(Codebase Researcher) | 动工前探索代码库,记录模式和风险 | Read、Grep、Glob | 只读,不能编辑任何文件 |
| 2. 故事撰写者(Story Writer) | 把粗略构想变成用户故事和验收标准 | Read | 只读,产出后等人类核准 |
| 3. 规格撰写者(Spec Writer) | 把核准的故事变成技术简报(蓝图) | Read、Grep、Glob | 只读,产出后等人类核准 |
| 4. 后端建造者(Backend Builder) | 实作 API、服务、数据库、后台任务、单测 | Read、Edit、Write、Bash | 只限后端文件夹 |
| 5. 前端建造者(Frontend Builder) | 实作 UI、组件、hooks、前端测试 | Read、Edit、Write、Bash | 只限前端文件夹 |
| 6. 测试验证者(Test Verifier) | 编写验收测试(非单元测试),从外部验证功能 | Read、Edit、Write、Bash | 只限测试文件 |
| 7. 验证员(Implementation Validator) | 对照故事和技术简报,报告实作差距 | Read、Grep、Glob | 只读,只报告不修复 |
三个人类审核点
工厂链中只有 3 个环节需要人类介入,其他全部自动运行:
- 核准用户故事(Human Review Point 1)—— 确认问题定义正确,不发明商业规则
- 核准技术简报(Human Review Point 2)—— 在代码被写之前捕获错误设计(如”把 ID 存在内存里”)
- 核准 PR(Human Review Point 3)—— 最终审查
这个设计的核心判断:人类应该留在”需要判断力”的环节(对的问题、对的设计、能不能安全上线),从”不需要判断力”的部分(代码实现、测试编写、差距检查)中退出。
职责隔离的工程价值
7 Agent 模式的关键工程价值不是”让 AI 更聪明”,而是防止错误传播:
- 后端建造者永远不可能不小心弄坏前端——因为它的工具权限不包含前端文件夹
- 前端建造者不会发明新的 API 端点——因为它先读后端建造者的摘要,按约定使用 API
- 错误假设在”规格撰写者”阶段就被人类捕获——而不是在 10 个文件被修改之后
- 验证员只看”磁盘上有什么”而不看”怎么被写出来的”——自评成绩单没有价值
CLAUDE.md 作为制度基础
7 Agent 工厂的运转依赖 CLAUDE.md 作为”永久项目事实”的载体:
- 技术栈声明(Next.js App Router、Node.js、Prisma、BullMQ、Resend)
- 项目指令(
npm run dev、npm test、npx prisma migrate dev) - 架构规则(“商业逻辑放在 services。API 路由保持薄。”)
- 禁止清单(“不要加 cron——用 BullMQ。不要把原始付款 payload 写进 log。”)
- 文档索引(
docs/billing.md、docs/architecture.md)
目标保持在 100-300 行。每次 AI 犯了一个让人惊讶的错误,就问”如果 CLAUDE.md 里有一条规则,这次能避免吗?“然后加进去。几周后 CLAUDE.md 变成”AI 曾经弄错的所有假设”的记录。
上下文漂移防控
软件工厂设计了一个隐性的上下文管理机制:因为每个 Agent 都有独立的上下文窗口,一个 Agent 内的错误假设不会传播到其他 Agent。这从根本上解决了上下文漂移问题——错的假设有天然的隔离边界。
对于架构级别的假设错误,工厂的建议是:丢掉整个对话重新开始,把对的假设烙进第一个 prompt——“一个有正确心智模型的干净对话,永远胜过一个打了补丁的对话”。
与其他方法论的关系
与 Vibe Coding 的关系
7 Agent 软件工厂是 Vibe Coding 的升级版,不是替代品。当项目复杂度较低时(独立开发者做 MVP、验证想法),Vibe Coding 的”凭感觉写代码”足够有效。但当项目规模增长到一定程度(如 Shawn 的 8.5 万行代码),单一 AI 对话的混乱度会超过可管理范围,此时需要引入 Agent 分工。
与 AI Workshop 多 Agent 协作的关系
AI Workshop 解决的是”多个 Agent 之间的共享记忆”问题(USER.md、WORKFLOW.md、CURRENT.md 共同事实源)。7 Agent 软件工厂解决的是”单个 Agent 的职责边界和工具权限”问题。两者可以互补使用——工厂的 7 个 Agent 可以接入 AI Workshop 的共享工作区。
与 AGENTS.md 的关系
AGENTS.md 规范文件 是项目规范文件,CLAUDE.md 在软件工厂中承担相同角色。区别是工厂中的 CLAUDE.md 还需要配合 .claude/agents/ 目录下的 7 个 Agent 定义文件,每个 Agent 有不同的工具权限声明。
不同素材中的观点
@sairahul1 的 7 Agent 工厂设计(来源:2026-05-31-blocktempo-7-agents-software-factory)
原文从一个尖锐的观察切入——“我以为我在用 AI 写代码。实际上,我只是打字打得比较快而已”——然后逐步拆解 Vibe Coding 的结构性天花板和 7 Agent 软件工厂的完整设计。每个 Agent 都有”它做什么”和”它不能做什么”的双面定义,配合工具权限矩阵(只读/只限后端/只限前端/只限测试),实现零概率交叉污染。文章最具洞察力的部分是对”上下文漂移”的分析:大部分 Claude Code 对话不是戏剧性地失败,而是漂移——一个错误假设进入上下文后模型继续往上叠加,导致错误扩散到代码各处。8 步设置清单(2-3 小时可完成)让方法论从理论落地为可执行操作。
实用信息
入门建议
- 从一个小功能开始走完整条链,观察它在哪里卡住,然后加规则
- 3-4 个功能后工厂就认识你的代码库,你会花更少时间监督,更多时间决策
- 工厂的价值在规模化——单一功能可能比 Vibe Coding 慢,但 10 个功能之后整体质量显著提升
- 前置条件:先写好 CLAUDE.md(100-300 行),这是一切的基础
- pre-commit hook 是最低成本的安全网,5 分钟设置可以避免
.env/.key泄露的大灾难
预计设置时间
2-3 小时完成全部 8 步设置。包括写 CLAUDE.md、建立 7 个 Agent 定义文件、创建 orchestrator skill 和 build-with-tests skill、配置 pre-commit hook。