研究了半年 Agent，我终于搞懂了为什么大部分团队都在做无用功

作者花了半年研究 Anthropic、OpenAI、LangChain 等团队的工程复盘，提炼出 Agent 工程的三层认知翻转：Agent 看不见环境、知识放错了地方、多 Agent 拆分方式错误。

基本信息

来源类型：article（网页文章）
原文位置：raw/articles/2026-06-10-agent-engineering-guide.md
原文 URL：https://juejin.cn/post/7619886405088690195
消化日期：2026-06-10

核心观点

Agent 的瓶颈不在模型，在环境：作者给内部项目搭了 Coding Agent，Demo 阶段惊艳，上线两周后 Agent 开始犯蠢——不是变笨了，是它自己写出来的代码慢慢污染了自己的环境，架构漂移的速度比修补速度还快。根本原因是 Agent 的运行环境缺乏规范和治理。
Agent “看不见”是第一层障碍：OpenAI Codex 团队发现早期 Coding Agent 写完代码就停了，不会自己验证。根本原因是 Agent 看不见系统状态——没有接入浏览器、日志查询、监控。接入 Chrome DevTools Protocol 后，Agent 能自己打开应用、截图、看 DOM、查日志，单次任务自主工作超过 6 小时。
知识放错了地方导致 Agent “变笨”：把所有规则塞进一个超长 agents.md 会适得其反——上下文有限，塞了 5000 行规则，留给任务本身的思考空间就被挤掉了。正确做法是”给 Agent 一张地图，而不是一本一千页的说明书”——小的 agents.md 当目录，详细知识拆到结构化子目录，按需读取。
按人类组织结构拆分多 Agent 是最低效方式：Anthropic 工程博客指出，写测试的 Agent 不知道实现 Agent 为什么这么写，做审查的 Agent 不了解前面排除过什么方案。它们之间反复解释背景消耗的 Token 甚至超过了真正干活的 Token。正确拆分方式是以上下文为中心——只有当两个任务的上下文可以真正隔离时，拆分才有意义。
不在仓库里的东西对 Agent 就不存在：Slack 讨论、Google Docs、同事脑子里的经验——全都是黑洞。必须把隐性知识显性化写到文件里，Agent 才能用。

实操内容保留

代码/配置

（本文无实操代码/配置）

Prompt 模板

（本文无 Prompt 模板）

操作步骤

作者给出的学习建议：

先跑起来：用 Cursor 或 Claude Code 做一个小项目，感受 Agent 怎么干活。别纠结理论，先动手。
踩坑就是学习：Agent 会犯蠢，你会生气，然后你会想”它为什么会这样”——这个思考过程就是理解 Agent 的过程。
犯错成本极低：Agent 时代最大的变化是你让 Agent 改代码，几秒钟就改好了。大胆试，快速迭代。

关键概念

上下文工程 — 文章核心主题之一：Agent 需要的不是更聪明的指令，而是能感知环境的基础设施；知识需要结构化管理而非一股脑塞进 prompt
AI Agent 智能体 — 文章讨论的核心对象，聚焦于 Agent 工程实践中的环境治理问题
上下文漂移 — 作者亲身经历的”架构漂移”本质就是上下文漂移——Agent 复制不规范实现并自我强化
Hermes Agent — 文末推荐的学习教程（Hermes Engineering）对应的 Agent 框架
AGENTS.md 规范文件 — 文章讨论的”给 Agent 一张地图”正是 AGENTS.md 的核心定位

与其他素材的关联

与 2026-05-28-agents-md-coding-standard 的关系：本文”知识放错了地方”的观点与莪_幻尘的 AGENTS.md 实践完全对齐——60-100 行的项目规范文件就是”地图”，详细知识拆到子目录就是”按需读取”
与 2026-05-31-blocktempo-7-agents-software-factory 的关系：本文”按人类组织结构拆分多 Agent 是最低效方式”与 @sairahul1 的上下文隔离视角互补——7 Agent 软件工厂的拆分逻辑正是”以上下文为中心”而非以人类职能为中心
与 2026-05-13-ai-agent-productivity-20x 的关系：本文”不在仓库里的东西对 Agent 就不存在”呼应了深思圈的上下文资产论——agents.md / memory.md / Skill / MCP 四类资产就是把隐性知识显性化的载体
与 2026-06-02-woshipm-agent-architecture-landing 的关系：本文从反面论证了 Agent 架构设计的重要性——环境治理失败的案例说明架构不是锦上添花而是地基

原文精彩摘录

跑 Demo 的时候特别惊艳——给一段需求描述，Agent 能自己读代码、写实现、跑测试、提 PR。整个过程行云流水。上线两周后，Agent 开始犯蠢。不是它变笨了。是它自己写出来的代码慢慢污染了自己的环境——它复制了一处不符合规范的实现，然后在后续任务里又复制了三处。架构漂移的速度比你修补的速度还快。

OpenAI 的 Codex 团队发现，早期的 Coding Agent 写完代码就停了——它不会自己去验证。不是不想，是它看不见系统状态。没有接入浏览器，没有日志查询，没有监控。他们后来做了什么？把 Chrome DevTools Protocol 接入 Agent 运行时。Agent 能自己打开应用、截图、看 DOM、查日志。做了这个改动之后，单次任务能自主工作超过 6 小时。

Anthropic 的工程博客直接把我打醒了：按人类组织结构拆分 Agent，是最低效的方式。写测试的 Agent 不知道实现 Agent 为什么这么写，做审查的 Agent 不了解前面排除过什么方案。它们之间反复解释背景消耗的 Token，甚至超过了真正干活的 Token。

个人知识库

探索

2026-06-10-agent-engineering-guide

研究了半年 Agent，我终于搞懂了为什么大部分团队都在做无用功

基本信息

核心观点

实操内容保留

代码/配置

Prompt 模板

操作步骤

关键概念

与其他素材的关联

原文精彩摘录

相关页面

关系图谱

快速导航

目录

反向链接