边缘计算

在数据产生的源头(设备端)直接进行计算和决策,而非将所有数据上传到云端处理的分布式计算范式。

关键信息

属性
领域分布式计算 / IoT
核心价值低延迟、离线可用、隐私保护、带宽节省
典型硬件ESP32、树莓派、NVIDIA Jetson、MCU
与云端的关系不是替代而是分工——边缘做实时决策,云端做训练和管理

核心特性

低延迟是核心驱动力

边缘计算最根本的价值在于把计算放在离数据源最近的地方。在消防预警场景中,地下车库 4G 信号差,从传感器节点到云端再返回的 RTT(Round Trip Time)至少 200-500ms,而火灾已经在烧了。改为边缘推理后,单帧推理延迟 < 50ms,网络只用于”事后回传数据”和”远程运维”。

离线可用是产品定义而非技术妥协

在很多关键场景(地下车库、矿井、地铁、船舶、隧道),网络连接不可靠甚至完全不可用。边缘计算的离线工作能力不是”降级体验”,而是产品定义里写死的硬性要求。断网也得工作——这是产品定位决定的,不是后来加上去的。

边缘与云端的分工模式

维度边缘云端
任务实时推理、本地决策模型训练、数据分析、远程管理
延迟< 50ms200-500ms+
网络依赖必须
模型大小受限(KB 级)不受限(GB 级)
更新频率低频 OTA持续迭代

模型压缩是边缘部署的关键挑战

将云端训练的大模型部署到边缘设备,需要经过 INT8 量化、模型剪枝、知识蒸馏等压缩技术。例如火眼哨兵的 1D-CNN 时序模型从训练版本压缩到 226K 参数、INT8 量化后仅 268KB,才能在 45 元的 ESP32-S3 MCU 上实时运行。

不同素材中的观点

来自 2026-06-18-woshipm-fireguard-edge-ai-fire-warning

  • 火眼哨兵团队选择边缘推理而非云端推理,核心理由是”断网也得工作”——这是消防场景的产品定义而非技术偏好。单帧推理延迟 < 50ms,代价是算法重写和模型压缩到 268KB。
  • “能跑通”和”能交付”是两个产品:Mamba-YOLOv8 推理一帧 180ms(CPU),完全不能上嵌入式,最终用 ONNX Runtime + 静态 INT8 量化才压到 50ms 以内,中间 5 个月是两者之间的距离。

实用信息

适用场景

  • 地下车库、矿井、地铁、船舶等网络不可靠环境
  • 需要毫秒级响应的实时控制场景
  • 隐私敏感的数据处理(数据不出设备)
  • 大规模部署时的带宽成本控制

典型技术栈

  • MCU 级:ESP32-S3、STM32 + TFLite Micro / ONNX Runtime
  • 边缘 GPU:NVIDIA Jetson Nano/Orin + TensorRT
  • 边缘 AI 框架:TensorFlow Lite、ONNX Runtime、Apache TVM

注意事项

  • 边缘设备算力有限,模型必须经过压缩(量化/剪枝/蒸馏)
  • 固件 OTA 更新机制必须可靠,否则模型迭代无法触达设备
  • 边缘与云端的数据同步策略需要精心设计,避免数据丢失或重复

相关页面

  • TinyML — 在微控制器上运行的超轻量机器学习
  • 火眼哨兵 — 边缘计算在消防预警领域的完整实践案例
  • 多模态传感器融合 — 边缘计算层的核心处理逻辑
  • MVP — “能跑通”到”能交付”的距离