又一个神级 Codex Skill 诞生了:红狐数据 API + Codex Skills 搭建 AI 热点雷达

用 Codex + 红狐数据 API 2 小时搭建 AI 热点雷达平台,自动采集抖音/小红书/公众号三平台 AI 热点,LLM 结构化分析生成机会评分,每天 5 分钟掌握 AI 话题动态

基本信息

核心观点

  1. 红狐数据是新媒体数据的”API 超市”:提供抖音、小红书、公众号、视频号、快手、微博、今日头条等多平台的内容数据 API,覆盖账号信息、文章详情、作品列表、搜索查询等维度。公众号有 6 个接口、小红书 2 个、抖音 2 个,还有 AI 图片/视频生成工具类 API。Skills 广场提供 40+ 开箱即用的数据分析技能,热门 Skill 调用量达 3.6 万次。

  2. Codex Skills 可以封装数据采集流程:红狐数据的 Skills 可直接装进 Codex/Claude Code 等 Agent 使用。每个 Skill 遵循标准三件套结构(SKILL.md + scripts/ + references/),包括 douyin-search(抖音爆款搜索)、wechat-10w-hot(公众号 10w+ 推荐)、xiaohongshu-weeklytop(小红书七日爆款 TOP50)、trending-hub(7 平台热搜聚合)。这证明 Skill 不仅用于代码和设计,也能封装数据采集和分析流程。

  3. AI 热点雷达的完整技术架构:Python 数据采集 + DeepSeek v4-pro LLM 分析 + 纯 HTML/CSS/JS 前端 + GitHub Actions 每日自动执行 + Nginx 部署,无数据库,每天数据写入 JSON 文件归档。整个项目从开发到部署半天完成,每天运行成本极低(API 调 15-20 次 + LLM 2000-3000 tokens)。

  4. 机会评分有数据支撑而非 LLM 随意打分:脚本先根据关键词匹配度和互动数据(点赞、评论、分享、收藏)算出 40-96 分的基础分,LLM 在此基础上微调。LLM 输出包含 dailySummary、topPicks(带机会评分+内容角度建议+风险提示)、platformInsights、contentAngles、riskNotes 五个结构化部分。LLM 失败时有模板降级方案。

  5. 三层容错设计保障数据采集稳定性:单个平台失败不影响其他平台;每个平台有备用 Skill,主 Skill 超时后降级到备用方案;API 调用间 0.15-0.25 秒延迟防频率限制;输出 JSON 包含 errors 数组记录异常。

实操内容保留

代码/配置

公众号文章搜索 API 调用示例:

curl -X POST "https://redfox.hk/story/api/gzhData/searchArticle" \
  -H "Content-Type: application/json" \
  -H "X-API-KEY: ak_your_api_key" \
  -d '{"keyword": "AI智能体", "offset": 0, "sortType": "_4"}'

sortType 说明:_4 按阅读数倒序,_2 按发布时间倒序。

响应结构:

{
  "code": 2000,
  "msg": "成功",
  "data": {
    "total": 100,
    "hasMore": true,
    "list": [
      {
        "title": "文章标题",
        "author": "作者",
        "readCount": 100001,
        "likeCount": 606,
        "commentCount": 3,
        "shareCount": 2613,
        "publishTime": "2026-06-07 18:00:00",
        "workUrl": "https://mp.weixin.qq.com/s/xxx"
      }
    ]
  }
}

所有接口统一 POST + JSON,认证用 X-API-KEY 请求头。

GitHub Actions 环境变量配置:

env:
  REDFOX_API_KEY: ${{ secrets.REDFOX_API_KEY }}
  LLM_API_KEY: ${{ secrets.LLM_API_KEY }}
  LLM_BASE_URL: ${{ secrets.LLM_BASE_URL }}
  LLM_MODEL: ${{ secrets.LLM_MODEL }}

Nginx 配置(含微信图片防盗链代理):

location / {
    root /home/www/aihot;
    try_files $uri $uri/ /index.html;
}
 
location ^~ /api/ {
    proxy_pass http://127.0.0.1:5173/api/;
    proxy_set_header Host $host;
    proxy_set_header X-Real-IP $remote_addr;
}
 
location ^~ /wechat-img/ {
    proxy_pass https://mmbiz.qpic.cn/;
    proxy_set_header Host mmbiz.qpic.cn;
    proxy_set_header Referer "https://mp.weixin.qq.com/";
}

Prompt 模板

LLM 分析架构(DailyAihotAgentRunner):

DailyAihotAgentRunner
├── SkillLoader → 读取 SKILL.md / references
├── RedFoxCollector → 执行 Skill scripts / 调 RedFox APIs
├── LlmAnalyzer → 调 LLM 生成结构化分析
├── Validator → 校验 JSON 字段和长度
└── SiteBuilder → 生成 HTML / JSON

LLM 需返回的 JSON 结构包含:dailySummary、topPicks(带 opportunityScore 0-100)、platformInsights、contentAngles、riskNotes。

操作步骤

  1. 在红狐数据(redfox.hk)申请 API Key
  2. 将 Skills 从 redfox.hk/skills 安装到 Codex/Claude Code
  3. 配置 GitHub Secrets(REDFOX_API_KEY、LLM_API_KEY、LLM_BASE_URL、LLM_MODEL)
  4. GitHub Actions 每天 00:30 自动执行 run_daily_agent.py
  5. 脚本按顺序:加载 Skills → 并行采集三平台数据 → 补全抖音详情 → LLM 结构化分析 → 生成站点文件
  6. 通过 SSH 部署到服务器,Nginx 提供静态文件服务

关键概念

  • Codex — 作为 Agent 平台承载红狐数据 Skills,实现数据采集自动化
  • Skill — 红狐数据 Skills 遵循标准三件套结构,可跨 Codex/Claude Code 复用
  • 红狐数据 — 新媒体数据平台,提供多平台内容数据 API 和 40+ 数据分析 Skills
  • GitHub Actions — 每天凌晨自动执行数据采集和分析流水线
  • DeepSeek — 默认使用的 LLM,用于结构化分析和机会评分

与其他素材的关联

  • 2026-06-02-woshipm-codex-10-practices 的关系:两篇都展示了 Codex 在非传统编程场景的应用——前者展示 10 个非编码玩法(追状态、做小工具、整理反馈),本文展示数据采集+分析+站点生成的完整项目
  • 2026-06-02-woshipm-codex-agent-workbench 的关系:本文是”Agent 工作台”概念的实战案例——SkillLoader + RedFoxCollector + LlmAnalyzer + Validator + SiteBuilder 五层架构正好对应 Agent 工作台的组件编排模式
  • 2026-06-02-koc-ollama-codex-local-model 的关系:本文默认用 DeepSeek v4-pro 而非 OpenAI 模型,验证了 Codex Skills 在非 OpenAI 模型下同样可用
  • 2026-06-02-woshipm-skill-creation-guide 的关系:红狐数据 Skills 是”主动梳理”路径的产物——从明确的数据采集目标出发,整理成标准 Skill 结构供社区复用

原文精彩摘录

每天凌晨自动跑一遍,把抖音、小红书、公众号三个平台上和AI相关的热点数据全部抓下来,扔给 LLM 做一轮结构化分析,给每条内容的算个评分。打开页面,5分钟就能知道今天有哪些 AI 话题值得聊,非常方便。这个项目用 Codex 前后也就是俩小时的调试,包括上线部署。

机会评分的计算不是 LLM 随意打的。脚本在发给 LLM 之前,会先根据关键词匹配度和互动数据(点赞、评论、分享、收藏)算出一个 40-96 分的基础分。LLM 在此基础上做微调,确保评分有数据支撑。

对于开发者来说,红狐数据的价值在于拿到 API 之后想怎么用就怎么用,搭看板、写脚本、接Agent、做自动化,都行。【开发者最大的优势是,别人用工具,我们造工具。】

相关页面