苍何：12 天 4.2K Star，用 Codex 远程指挥 Agent 做开源项目的全流程

作者苍何在医院陪护期间，仅用手机远程连接 Mac Mini 上的 Codex APP，通过 Browser Use + Computer Use + GitHub + Vercel 全自动化流水线，12 天内将 GPT-image2 提示词开源项目做到 4.2K Star，并同步完成可视化网站开发和 CodexGuide 教程知识库搭建。

基本信息

来源类型：文章
原文位置：raw/articles/2026-06-13-120525-tg-5ecb50.md
原文 URL：https://juejin.cn/post/7643288575246549001
消化日期：2026-06-13
作者：苍何（第 530 篇原创）
发布时间：2026-05-25

核心观点

Codex APP 的 Browser Use + Computer Use 能力远超预期：作者发现 Codex APP 能自行打开 X/Twitter 搜索并浏览帖子、下载图片、提取提示词，还能自行打开电脑里的 APP 进行操作——这种”自行探索+执行”的能力比 OpenClaw 的黑盒子式 Agent 模式更丝滑。配合 Browser Use 不需要配 API，Codex 能直接操作浏览器完成数据采集任务。
手机即可远程指挥 Mac Mini 上的 Codex 24 小时工作：作者在医院期间仅用手机连接 Mac Mini 上的 Codex APP，通过语音下达指令（typeless 语音），实现了”不碰电脑也能指挥 Agent 做开源项目”的全流程。Mac Mini 作为常驻服务器，电脑、手机、iPad 均可随时连接指挥。
GitHub + Vercel 实现全自动部署闭环：Codex 完成代码修改后自动推送到 GitHub，Vercel 自动检测变更并重新部署网站。作者设置”10 分钟内不确认则自行决策是否发布”的自动化规则，进一步减少人工干预。整个流程从搜集提示词到网站上线，全程自动化。
Codex 团队的工作方式值得借鉴：OpenAI Codex 团队不是传统 roadmap + 大 PRD 模式，而是”短期判断 + 长期方向，中间靠原型探索收敛”，很少写 Spec 文档。作者建议直接向 Codex 描述初始需求，反复确认方案后再执行，而不是一上来就让它执行。
同一套工作流可横向复用到多个项目：作者用这套 Codex 远程指挥工作流完成了三个项目——GPT-image2 提示词开源项目（4.2K Star）、配套可视化网站（gpt-image2.canghe.ai）、CodexGuide 教程知识库（codexguide.ai）。建议分开任务层级做不同的 Chat，跨项目可通过工作树方式串连。

实操内容保留

操作步骤

实现 Codex 远程指挥工作流的完整步骤：

安装必要插件：GitHub、Vercel、Browser Use、Computer Use（如有本地 GitHub CLI 或 Vercel CLI 也可不装插件）
选择项目文件夹：在 Codex APP 中选定项目文件夹，后续所有改动基于该文件夹，项目会直接和 GitHub 仓库连接
开启完全访问模式（非工作机推荐）：跳过每次确认授权，直接开干
描述需求：通过语音或文字向 Codex 描述初始需求，让它理解意图后反复确认方案，再开始执行
分 Chat 管理不同任务：搜集 Prompt 和网站开发放在不同的 Chat 中，跨项目可通过工作树方式串连
设置自动化规则：如”10 分钟内不确认则自行决策是否发布”，减少人工干预
保持 Codex APP 常驻：Mac Mini 上 24 小时运行，手机/iPad 随时可连接指挥

自动化流水线设计

Codex Browser Use 打开 X/Twitter
    → 搜索最近 24 小时 GPT-image 2 相关帖子
    → 找到含 Prompt 的帖子并下载图片
    → 提取提示词
    → 按 GitHub 项目分类规则自动归类
    → 值得提取模板的给建议
    → 10 分钟内无人确认则自行决策
    → Git push 到 GitHub
    → Vercel 自动部署
    → 网站实时展示最新案例和提示词

语音指令示例

作者通过 typeless 语音直接下达指令，“不够复杂，但足够精准”。例如：

“搜集 X 上最近 24 小时 GPT-image 2 的提示词”
“按照项目分类规则自动归类，有值得提取模板的给建议”

关键概念

Codex — OpenAI 的任务执行型 AI 工具，本文核心工具，通过 Browser Use + Computer Use 实现远程指挥
GPT Image 2 — OpenAI 图像生成模型，本文的开源项目主题（awesome-gpt-image-2）
Computer Use — AI 操控用户电脑的能力（截屏、鼠标、键盘），本文中 Codex 用它打开本地 APP
Browser Use — AI 操控浏览器的能力，本文中 Codex 用它自动打开 X/Twitter 搜索和采集数据
OpenClaw — 作者对比的另一个 Agent 编排工具，认为其黑盒子模式不及 Codex 远程指挥丝滑
Vercel — 前端部署平台，与 GitHub 联动实现自动部署
CodexGuide — 作者创建的 Codex 教程开源项目（codexguide.ai）

与其他素材的关联

与 2026-05-28-codex-11-tips 的关系：本文是 Codex 官方团队 11 条技巧的实战验证——作者的远程指挥工作流恰好体现了 Durable Threads（长期对话）、Browser Use/Computer Use（四层工具扩展）、Shared Memory（项目文件夹常驻）等官方推荐机制
与 2026-06-02-woshipm-codex-agent-workbench 的关系：本文作者的实践印证了”Agent 工作台”定位——Codex 不只是编程工具，而是集成了浏览器自动化、桌面控制、Git 部署的完整任务执行环境
与 2026-06-02-woshipm-codex-10-practices 的关系：苍何的”手机指挥 Mac Mini”模式是”非程序员也能用 Codex”的极端案例——连电脑都不碰，纯语音下达指令
与 2026-05-10-gpt-image-2-prompt-templates 的关系：本文提到的 awesome-gpt-image-2 开源项目正是苍何之前创建的 329 条提示词模板库，本文描述的是该项目的持续迭代过程
与 2026-05-25-openclaw-deepseek-content-automation-sop 的关系：作者明确对比了 OpenClaw 和 Codex，认为 OpenClaw 的黑盒子式 Agent 模式不及 Codex 远程指挥丝滑——这是两种 Agent 编排范式的直接比较

原文精彩摘录

这次的全新 Agentic Coding 体验，让我意识到一点，OpenClaw 的黑盒子式的 Agent 模式，可能还不及一个远程指挥 Codex APP 来的丝滑。我通过飞书去连接龙虾，然后让龙虾指挥 Claude Code 来 Coding，我已经跑了一段时间，我发现，对于功能性校验测试太不丝滑了。我发现 Codex APP 在 Browser Use（浏览器自动化）和 Computer Use（控制电脑 APP）太智能了，它能自行打开 web 页面，查看 bug，还能自行打开电脑里面的 APP，用 Agent 控制。

你会发现，这个流程我搭建好后，我全程只需要做最后的确认工作，看看这个图怎么样啊，分类对不对啊，值不值得提炼出模板啊。其他都交给 Codex 就好了。设置一个自动化规则，每天让他去跑，我来做决策。我的 Codex APP 泡在 Mac Mini 上，电脑、手机或者 Ipad 可以直接连上，24 小时指挥他干活。

Codex 团队不是传统 roadmap + 大 PRD 模式，而是短期判断 + 长期方向，中间靠原型探索收敛。他们甚至很少写 Spec 文档。基于该观点，直接向 Codex 描述你的初始需求，让 Codex 理解你的意图后，再开始开发，你可以反复和他确认方案，而不是一上来就让他执行。

个人知识库

探索

2026-06-13-canghe-gpt-image2-codex-agentic-workflow

苍何：12 天 4.2K Star，用 Codex 远程指挥 Agent 做开源项目的全流程

基本信息

核心观点

实操内容保留

操作步骤

自动化流水线设计

语音指令示例

关键概念

与其他素材的关联

原文精彩摘录

相关页面

关系图谱

快速导航

目录

反向链接