Agent Harness

AI 军团协作的管控框架,让多个 Agent 在可控边界内并行工作的编排系统

简介

Agent Harness 是管理多个 AI Agent 协作的系统性框架。它不是某个具体工具或产品,而是一套架构思路——定义 AI 能用什么规则、什么工具,系统之间怎么连,想法如何按规范产出,产出如何追踪和审计。

这个概念由掘金用户”道里”在花了 5 万美金使用 Claude Code + Codex 后明确提出,他将 Harness 拆为四层架构:能力层、连接层、构建层、管控层。Anthropic 的 16 Agent 并行构建 C 编译器项目、OpenAI 的 Build AI-Native Engineering Team 框架、Claude Code 的 Agent Teams 功能,本质上都在做 Harness 这件事。

四层架构

能力层(Capability Layer)

AI 能用什么规则、什么工具。包括:

  • 规则定义:AGENTS.md、CLAUDE.md 等行为规范文件
  • 工具接入:MCP 协议连接外部能力
  • 技能封装:Skill 把经验变成可复用能力包
  • 知识注入:上下文工程,把业务知识结构化给到 AI

连接层(Connection Layer)

系统之间怎么连。包括:

  • Agent 间通信:leader + teammate 共享任务列表
  • 工具链编排:多个 MCP server 的串联和调度
  • 数据流转:raw → wiki → publish 的管道设计
  • 外部系统集成:API、数据库、CI/CD 的接入

构建层(Construction Layer)

想法如何按规范产出。包括:

  • 任务分解:把大目标拆成 Agent 可执行的子任务
  • 质量门禁:测试、lint、类型检查等自动验证
  • 产出规范:PRD、代码、文档的格式和结构要求
  • 迭代机制:plan → execute → review → refine 循环

管控层(Governance Layer)

产出如何追踪和审计。包括:

  • 人机边界定义:哪些委派给 AI、哪些人来审查、哪些人必须拥有
  • 执行监控:Agent 行为追踪、异常检测
  • 风险控制:红线约束、回滚机制、CI 防止回退
  • 审计日志:决策历史、变更记录

核心特性

从零自建 vs 基于成熟方案

自建 Agent Harness 的价值正在降低。原因:

  • 模型迭代速度太快,小 team 根本跟不上
  • 花几周沉淀的约束体系,模型能力一跳就变成多余的
  • 模型公司(Anthropic、OpenAI)会持续提供基座 Harness

真正有价值的是基于成熟 Harness 做垂直方案

  • 为老工作流重新设计 AI Native 的 Agent 工作流
  • 在 Human-in-the-Loop 部分重新设计 UI 和 UX 交互
  • 垂直领域的高质量数据整理
  • 把行业专家的判断路径变成 AI 可执行的流程

多 Agent 的本质价值

多 Agent 的价值不在于模拟人类分工,而在于:

  • 隔离上下文:每个 Agent 在独立上下文里干活,错误不会传播
  • 并行执行:多个任务同时推进,效率倍增
  • 职责单一:每个 Agent 只做一件事,降低复杂度

但前提是 plan 质量够高——plan 烂了,9 个 agent 只是 9 倍速制造垃圾。

不同素材中的观点

道里(花了 5 万刀用 AI 写代码之后):Harness 是当下最务实的选择,但它是过渡态。本质上还是人在给 AI 写规则——定义边界、维护契约、设置验证门禁。未来 Harness 会从人写的静态规则,变成 AI 基于历史执行数据自我迭代的动态约束。四层架构(能力层、连接层、构建层、管控层)对任何项目或业务都通用。——来源:2026-06-13-juejin-50k-usd-ai-coding-lessons

Deep Agents 框架:LangChain 团队开源的 Agent Harness 实现,基于 LangGraph 执行引擎,提供工具注册、记忆管理、任务编排等标准化能力。验证了”基于成熟 Harness 做垂直方案”的路径。——来源:2026-06-13-deep-agents-framework-guide

AI 团队翻车案例:16 个 Agent 运营 13 个平台的实践暴露了没有 Harness 的后果——架构漏洞比工具故障更危险,管 Agent 和管人本质一样。反面验证了 Harness 管控层的必要性。——来源:2026-06-13-juejin-ai-team-crash-3-lessons

实用信息

判断是否需要 Harness

  • 单 Agent 能搞定的任务,不需要 Harness
  • 多 Agent 并行、需要跨系统协作、有质量要求时,Harness 才有价值
  • 适合就好,不要追求完美的框架,够用、能跑、能迭代就行

Agent 是未来的操作系统

模型公司提供模型和 Harness(iOS/Android),真正的价值在上层应用。谁先在自己的领域里把 AI Native 的全链路跑通,谁就有壁垒——这个壁垒不是技术壁垒,是业务理解的壁垒。

相关页面