漏斗式 Agent

一种务实的企业级 AI 自动化范式:将业务规则拆为三层过滤——机器处理客观规则,中等难度自动流转,疑难杂症留给人工——放弃”100% 全自动化”幻想,让人聚焦在最有价值的判断上。

简介

漏斗式 Agent(Funnel Agent)是一种面向企业生产环境的 AI 自动化架构模式。它的核心理念是”做减法”而非”做加法”——不是试图让 AI 一次搞定所有规则,而是把规则按难度分层,让机器处理客观、好判断的部分,把困难、主观的数据漏斗到底层交给人工。

这个模式与传统”端到端自动化”形成鲜明对比。端到端方案追求”用一个大模型搞定所有维度”,但在标签数量多(200+)、规则复杂度高的场景中,准确率会严重崩盘。漏斗式 Agent 通过分层切分,把”人”的价值从”什么都干”聚焦到”只干最难的事”,既保障基础数据准确性(机器不会因疲惫产生低级错误),又最大化人的核心价值(8 小时全部集中在高难度 Case)。

漏斗式 Agent 的设计哲学与 ReAct 框架同源——每个节点都是”规则执行→观察结果→决定放行或流转”的循环,但漏斗式 Agent 在此基础上加入了”宁可放过,不可标错”的保守策略和人工兜底层,使其更适合企业级生产环境。

关键信息

  • 类型:概念 / 方法论
  • 领域:企业 AI 落地 / 数据标注 / 内容审核 / 多标签分类
  • 相关概念人机协同(机器+人工接力)、ReAct(节点串联机制)、AI Agent 智能体(Agent 架构)、工作SOP(流程化)、MVP(最小验证)
  • 首次提出:林航旗《AI 数据标注降本实战分享》(2026-05-08)

核心特性

三层过滤机制

漏斗式 Agent 的核心架构是三层递进式过滤:

  1. 第一层(机器自动处理):客观、好判断的规则用机器处理。例如”资金交易”类——只要提到具体钱数就直接打标。这一层处理的是规则明确、判断标准清晰、不需要上下文推理的任务。

  2. 第二层(中等难度流转):第一层没命中的数据流转到下一层,处理中等难度的规则。这一层可能需要一定程度的上下文理解或简单的推理判断。

  3. 第三层(人工兜底):机器遇到任何模糊点都遵循”宁可放过,不可标错”原则留空。最终漏下来的纯疑难杂症才交给人工处理。人工 8 小时全部集中在高难度 Case 上。

选择器自动流转逻辑:字段非空 = 成功拦截(已完成处理),字段为空 = 漏到下一节点。这个设计使得每个节点只输出自己有把握的结果,没把握的自动往下流转。

“宁可放过,不可标错”原则

这是漏斗式 Agent 最核心的设计约束:

  • 严格设定输出条件:模型只有在非常确定时才打标签
  • 遇事不决直接放行:遇到任何模糊情况,留空输出
  • 与”应标尽标”形成对立——后者要求找出所有违规点,前者只保证命中任意一个致命标签就打回

这个原则的业务逻辑是:只要一条内容命中了任何一个致命标签,它就已经是”废料”,注定被过滤掉。不需要”找出所有违规点”。

Prompt 专人专用

漏斗式 Agent 的每个节点只负责一个维度的深度打分,而不是把 20 多个评分维度全塞进一个 Prompt。核心原因:

  • 一个 Prompt 塞所有维度等于让一个人同时干产品经理、搞算法、做调研、跑销售——啥也干不好
  • 多消耗一点 Token 微不足道,换来的准确率提升是巨大的
  • 手动改 Prompt 致命——上下文高度关联,改一行可能破坏第三行的补充逻辑

人标数据驱动三层应用

高质量人工标注数据在漏斗式 Agent 中有三个核心用途:

  1. 作为测试集:构建黄金测试集(至少两轮质检),机器跑测与人标 Diff 比对,不一致即判定”模型错”,将 Bad Case 抛给 AI 自动迭代新版 Prompt
  2. 作为训练集:上万条高准人标数据做 LoRA 微调,特定标签准确率飙升至 99%
  3. 作为安全护城河:离线→仿真(真实数据双跑,机标不出库)→小流量(10% 纯机标)→逐步扩量(20%→50%→全量)

不同素材中的观点

  • 2026-05-27-woshipm-ai-data-annotation-cost-reduction(林航旗):首次系统化提出漏斗式 Agent 概念。以数据标注场景为背景,验证了三层过滤机制在四个实战案例中的效果——纯文本处理 CPH 从 2 提升到 6(知识库 RAG 辅助归纳)、复杂 Agent 评测用漏斗式清洗+可视化降维替代数个人力、200+ 标签分类用”选品优先+多模型投票+小大模型接力”实现每天近一半数据自动化替代、短剧多模态用 ASR 时间戳精准抽帧绕过模型能力边界。核心贡献是把”100% 全自动化”的执念打破,给出可量化的”人机接力”工程范式。

实用信息

  • 适用场景:内容审核(违规标签分类)、数据标注(多标签分类、意图识别)、Agent 评测(主观+客观混合规则)、任何”规则多、判断模糊、错误代价高”的企业 AI 场景
  • 不适用场景:规则极简(<5 条)、全部可形式化、错误代价低的纯自动化场景
  • 快速上手步骤
    1. 列出所有业务规则,按”客观可形式化 / 需要一定推理 / 高度主观”三档分类
    2. 第一档做成机器节点,第二档做成中等难度节点,第三档留空交人工
    3. 节点串联:字段非空=成功,字段为空=流转到下一层
    4. 先用少量数据验证,再按”离线→仿真→小流量→全量”上线
  • 注意事项
    • 千万不能离线跑出高分就直接全量机标,必须走四阶段上线策略
    • 千万不要让大模型一次性处理所有规则——“专人专用”是准确率的生命线
    • 接项目前必须先算 ROI——4 人小项目自动化价值不大,50 人大项目才值得投入
    • 技术解不了的死局可以通过业务谈判破——把需求从”找出所有违规点”改为”命中任意一个致命标签就打回”

相关页面