7 Agent 软件工厂

把单一 AI 对话拆成 7 个专责 Agent,每个拥有单一职责、干净上下文和严格工具权限边界——从 Vibe Coding 升级到结构化多 Agent 开发的方法论

简介

7 Agent 软件工厂是 @sairahul1 提出的 Claude Code 多 Agent 开发方法论,核心理念是:当你在单个 AI 对话里要求它同时扮演产品分析师、架构师、后端工程师、前端工程师、测试工程师和代码审查员时,错误会在混乱的对话中累积——“第 1 天像魔法,第 30 天你花在监督 AI 的时间比自己写代码还多”。

软件工厂把工作拆给 7 个专门化 Agent,每个 Agent 只拥有自己需要的工具权限和操作边界,从而实现:干净的上下文窗口(每个 Agent 只装它需要的信息)、严格的职责隔离(后端 Agent 永远不会碰前端代码)、人类审核点前置(错误在”技术简报核准”阶段就被捕获,而不是 10 个文件被改完之后)。

这是 Vibe Coding 方法论在项目复杂度超过单一 AI 对话承载力时的升级路径。

核心特征

七 Agent 架构

Agent职责工具权限操作边界
1. 研究员(Codebase Researcher)动工前探索代码库,记录模式和风险Read、Grep、Glob只读,不能编辑任何文件
2. 故事撰写者(Story Writer)把粗略构想变成用户故事和验收标准Read只读,产出后等人类核准
3. 规格撰写者(Spec Writer)把核准的故事变成技术简报(蓝图)Read、Grep、Glob只读,产出后等人类核准
4. 后端建造者(Backend Builder)实作 API、服务、数据库、后台任务、单测Read、Edit、Write、Bash只限后端文件夹
5. 前端建造者(Frontend Builder)实作 UI、组件、hooks、前端测试Read、Edit、Write、Bash只限前端文件夹
6. 测试验证者(Test Verifier)编写验收测试(非单元测试),从外部验证功能Read、Edit、Write、Bash只限测试文件
7. 验证员(Implementation Validator)对照故事和技术简报,报告实作差距Read、Grep、Glob只读,只报告不修复

三个人类审核点

工厂链中只有 3 个环节需要人类介入,其他全部自动运行:

  1. 核准用户故事(Human Review Point 1)—— 确认问题定义正确,不发明商业规则
  2. 核准技术简报(Human Review Point 2)—— 在代码被写之前捕获错误设计(如”把 ID 存在内存里”)
  3. 核准 PR(Human Review Point 3)—— 最终审查

这个设计的核心判断:人类应该留在”需要判断力”的环节(对的问题、对的设计、能不能安全上线),从”不需要判断力”的部分(代码实现、测试编写、差距检查)中退出。

职责隔离的工程价值

7 Agent 模式的关键工程价值不是”让 AI 更聪明”,而是防止错误传播

  • 后端建造者永远不可能不小心弄坏前端——因为它的工具权限不包含前端文件夹
  • 前端建造者不会发明新的 API 端点——因为它先读后端建造者的摘要,按约定使用 API
  • 错误假设在”规格撰写者”阶段就被人类捕获——而不是在 10 个文件被修改之后
  • 验证员只看”磁盘上有什么”而不看”怎么被写出来的”——自评成绩单没有价值

CLAUDE.md 作为制度基础

7 Agent 工厂的运转依赖 CLAUDE.md 作为”永久项目事实”的载体:

  • 技术栈声明(Next.js App Router、Node.js、Prisma、BullMQ、Resend)
  • 项目指令(npm run devnpm testnpx prisma migrate dev
  • 架构规则(“商业逻辑放在 services。API 路由保持薄。”)
  • 禁止清单(“不要加 cron——用 BullMQ。不要把原始付款 payload 写进 log。”)
  • 文档索引(docs/billing.mddocs/architecture.md

目标保持在 100-300 行。每次 AI 犯了一个让人惊讶的错误,就问”如果 CLAUDE.md 里有一条规则,这次能避免吗?“然后加进去。几周后 CLAUDE.md 变成”AI 曾经弄错的所有假设”的记录。

上下文漂移防控

软件工厂设计了一个隐性的上下文管理机制:因为每个 Agent 都有独立的上下文窗口,一个 Agent 内的错误假设不会传播到其他 Agent。这从根本上解决了上下文漂移问题——错的假设有天然的隔离边界。

对于架构级别的假设错误,工厂的建议是:丢掉整个对话重新开始,把对的假设烙进第一个 prompt——“一个有正确心智模型的干净对话,永远胜过一个打了补丁的对话”。

与其他方法论的关系

与 Vibe Coding 的关系

7 Agent 软件工厂是 Vibe Coding 的升级版,不是替代品。当项目复杂度较低时(独立开发者做 MVP、验证想法),Vibe Coding 的”凭感觉写代码”足够有效。但当项目规模增长到一定程度(如 Shawn 的 8.5 万行代码),单一 AI 对话的混乱度会超过可管理范围,此时需要引入 Agent 分工。

与 AI Workshop 多 Agent 协作的关系

AI Workshop 解决的是”多个 Agent 之间的共享记忆”问题(USER.md、WORKFLOW.md、CURRENT.md 共同事实源)。7 Agent 软件工厂解决的是”单个 Agent 的职责边界和工具权限”问题。两者可以互补使用——工厂的 7 个 Agent 可以接入 AI Workshop 的共享工作区。

与 AGENTS.md 的关系

AGENTS.md 规范文件 是项目规范文件,CLAUDE.md 在软件工厂中承担相同角色。区别是工厂中的 CLAUDE.md 还需要配合 .claude/agents/ 目录下的 7 个 Agent 定义文件,每个 Agent 有不同的工具权限声明。

不同素材中的观点

@sairahul1 的 7 Agent 工厂设计(来源:2026-05-31-blocktempo-7-agents-software-factory

原文从一个尖锐的观察切入——“我以为我在用 AI 写代码。实际上,我只是打字打得比较快而已”——然后逐步拆解 Vibe Coding 的结构性天花板和 7 Agent 软件工厂的完整设计。每个 Agent 都有”它做什么”和”它不能做什么”的双面定义,配合工具权限矩阵(只读/只限后端/只限前端/只限测试),实现零概率交叉污染。文章最具洞察力的部分是对”上下文漂移”的分析:大部分 Claude Code 对话不是戏剧性地失败,而是漂移——一个错误假设进入上下文后模型继续往上叠加,导致错误扩散到代码各处。8 步设置清单(2-3 小时可完成)让方法论从理论落地为可执行操作。

实用信息

入门建议

  1. 从一个小功能开始走完整条链,观察它在哪里卡住,然后加规则
  2. 3-4 个功能后工厂就认识你的代码库,你会花更少时间监督,更多时间决策
  3. 工厂的价值在规模化——单一功能可能比 Vibe Coding 慢,但 10 个功能之后整体质量显著提升
  4. 前置条件:先写好 CLAUDE.md(100-300 行),这是一切的基础
  5. pre-commit hook 是最低成本的安全网,5 分钟设置可以避免 .env / .key 泄露的大灾难

预计设置时间

2-3 小时完成全部 8 步设置。包括写 CLAUDE.md、建立 7 个 Agent 定义文件、创建 orchestrator skill 和 build-with-tests skill、配置 pre-commit hook。

相关页面