苍何:12 天 4.2K Star,用 Codex 远程指挥 Agent 做开源项目的全流程

作者苍何在医院陪护期间,仅用手机远程连接 Mac Mini 上的 Codex APP,通过 Browser Use + Computer Use + GitHub + Vercel 全自动化流水线,12 天内将 GPT-image2 提示词开源项目做到 4.2K Star,并同步完成可视化网站开发和 CodexGuide 教程知识库搭建。

基本信息

  • 来源类型:文章
  • 原文位置:raw/articles/2026-06-13-120525-tg-5ecb50.md
  • 原文 URLhttps://juejin.cn/post/7643288575246549001
  • 消化日期:2026-06-13
  • 作者:苍何(第 530 篇原创)
  • 发布时间:2026-05-25

核心观点

  1. Codex APP 的 Browser Use + Computer Use 能力远超预期:作者发现 Codex APP 能自行打开 X/Twitter 搜索并浏览帖子、下载图片、提取提示词,还能自行打开电脑里的 APP 进行操作——这种”自行探索+执行”的能力比 OpenClaw 的黑盒子式 Agent 模式更丝滑。配合 Browser Use 不需要配 API,Codex 能直接操作浏览器完成数据采集任务。

  2. 手机即可远程指挥 Mac Mini 上的 Codex 24 小时工作:作者在医院期间仅用手机连接 Mac Mini 上的 Codex APP,通过语音下达指令(typeless 语音),实现了”不碰电脑也能指挥 Agent 做开源项目”的全流程。Mac Mini 作为常驻服务器,电脑、手机、iPad 均可随时连接指挥。

  3. GitHub + Vercel 实现全自动部署闭环:Codex 完成代码修改后自动推送到 GitHub,Vercel 自动检测变更并重新部署网站。作者设置”10 分钟内不确认则自行决策是否发布”的自动化规则,进一步减少人工干预。整个流程从搜集提示词到网站上线,全程自动化。

  4. Codex 团队的工作方式值得借鉴:OpenAI Codex 团队不是传统 roadmap + 大 PRD 模式,而是”短期判断 + 长期方向,中间靠原型探索收敛”,很少写 Spec 文档。作者建议直接向 Codex 描述初始需求,反复确认方案后再执行,而不是一上来就让它执行。

  5. 同一套工作流可横向复用到多个项目:作者用这套 Codex 远程指挥工作流完成了三个项目——GPT-image2 提示词开源项目(4.2K Star)、配套可视化网站(gpt-image2.canghe.ai)、CodexGuide 教程知识库(codexguide.ai)。建议分开任务层级做不同的 Chat,跨项目可通过工作树方式串连。

实操内容保留

操作步骤

实现 Codex 远程指挥工作流的完整步骤:

  1. 安装必要插件:GitHub、Vercel、Browser Use、Computer Use(如有本地 GitHub CLI 或 Vercel CLI 也可不装插件)
  2. 选择项目文件夹:在 Codex APP 中选定项目文件夹,后续所有改动基于该文件夹,项目会直接和 GitHub 仓库连接
  3. 开启完全访问模式(非工作机推荐):跳过每次确认授权,直接开干
  4. 描述需求:通过语音或文字向 Codex 描述初始需求,让它理解意图后反复确认方案,再开始执行
  5. 分 Chat 管理不同任务:搜集 Prompt 和网站开发放在不同的 Chat 中,跨项目可通过工作树方式串连
  6. 设置自动化规则:如”10 分钟内不确认则自行决策是否发布”,减少人工干预
  7. 保持 Codex APP 常驻:Mac Mini 上 24 小时运行,手机/iPad 随时可连接指挥

自动化流水线设计

Codex Browser Use 打开 X/Twitter
    → 搜索最近 24 小时 GPT-image 2 相关帖子
    → 找到含 Prompt 的帖子并下载图片
    → 提取提示词
    → 按 GitHub 项目分类规则自动归类
    → 值得提取模板的给建议
    → 10 分钟内无人确认则自行决策
    → Git push 到 GitHub
    → Vercel 自动部署
    → 网站实时展示最新案例和提示词

语音指令示例

作者通过 typeless 语音直接下达指令,“不够复杂,但足够精准”。例如:

  • “搜集 X 上最近 24 小时 GPT-image 2 的提示词”
  • “按照项目分类规则自动归类,有值得提取模板的给建议”

关键概念

  • Codex — OpenAI 的任务执行型 AI 工具,本文核心工具,通过 Browser Use + Computer Use 实现远程指挥
  • GPT Image 2 — OpenAI 图像生成模型,本文的开源项目主题(awesome-gpt-image-2)
  • Computer Use — AI 操控用户电脑的能力(截屏、鼠标、键盘),本文中 Codex 用它打开本地 APP
  • Browser Use — AI 操控浏览器的能力,本文中 Codex 用它自动打开 X/Twitter 搜索和采集数据
  • OpenClaw — 作者对比的另一个 Agent 编排工具,认为其黑盒子模式不及 Codex 远程指挥丝滑
  • Vercel — 前端部署平台,与 GitHub 联动实现自动部署
  • CodexGuide — 作者创建的 Codex 教程开源项目(codexguide.ai)

与其他素材的关联

  • 2026-05-28-codex-11-tips 的关系:本文是 Codex 官方团队 11 条技巧的实战验证——作者的远程指挥工作流恰好体现了 Durable Threads(长期对话)、Browser Use/Computer Use(四层工具扩展)、Shared Memory(项目文件夹常驻)等官方推荐机制
  • 2026-06-02-woshipm-codex-agent-workbench 的关系:本文作者的实践印证了”Agent 工作台”定位——Codex 不只是编程工具,而是集成了浏览器自动化、桌面控制、Git 部署的完整任务执行环境
  • 2026-06-02-woshipm-codex-10-practices 的关系:苍何的”手机指挥 Mac Mini”模式是”非程序员也能用 Codex”的极端案例——连电脑都不碰,纯语音下达指令
  • 2026-05-10-gpt-image-2-prompt-templates 的关系:本文提到的 awesome-gpt-image-2 开源项目正是苍何之前创建的 329 条提示词模板库,本文描述的是该项目的持续迭代过程
  • 2026-05-25-openclaw-deepseek-content-automation-sop 的关系:作者明确对比了 OpenClaw 和 Codex,认为 OpenClaw 的黑盒子式 Agent 模式不及 Codex 远程指挥丝滑——这是两种 Agent 编排范式的直接比较

原文精彩摘录

这次的全新 Agentic Coding 体验,让我意识到一点,OpenClaw 的黑盒子式的 Agent 模式,可能还不及一个远程指挥 Codex APP 来的丝滑。我通过飞书去连接龙虾,然后让龙虾指挥 Claude Code 来 Coding,我已经跑了一段时间,我发现,对于功能性校验测试太不丝滑了。我发现 Codex APP 在 Browser Use(浏览器自动化)和 Computer Use(控制电脑 APP)太智能了,它能自行打开 web 页面,查看 bug,还能自行打开电脑里面的 APP,用 Agent 控制。

你会发现,这个流程我搭建好后,我全程只需要做最后的确认工作,看看这个图怎么样啊,分类对不对啊,值不值得提炼出模板啊。其他都交给 Codex 就好了。设置一个自动化规则,每天让他去跑,我来做决策。我的 Codex APP 泡在 Mac Mini 上,电脑、手机或者 Ipad 可以直接连上,24 小时指挥他干活。

Codex 团队不是传统 roadmap + 大 PRD 模式,而是短期判断 + 长期方向,中间靠原型探索收敛。他们甚至很少写 Spec 文档。基于该观点,直接向 Codex 描述你的初始需求,让 Codex 理解你的意图后,再开始开发,你可以反复和他确认方案,而不是一上来就让他执行。

相关页面