边缘计算

在数据产生的源头（设备端）直接进行计算和决策，而非将所有数据上传到云端处理的分布式计算范式。

关键信息

属性	值
领域	分布式计算 / IoT
核心价值	低延迟、离线可用、隐私保护、带宽节省
典型硬件	ESP32、树莓派、NVIDIA Jetson、MCU
与云端的关系	不是替代而是分工——边缘做实时决策，云端做训练和管理

核心特性

低延迟是核心驱动力

边缘计算最根本的价值在于把计算放在离数据源最近的地方。在消防预警场景中，地下车库 4G 信号差，从传感器节点到云端再返回的 RTT（Round Trip Time）至少 200-500ms，而火灾已经在烧了。改为边缘推理后，单帧推理延迟 < 50ms，网络只用于”事后回传数据”和”远程运维”。

离线可用是产品定义而非技术妥协

在很多关键场景（地下车库、矿井、地铁、船舶、隧道），网络连接不可靠甚至完全不可用。边缘计算的离线工作能力不是”降级体验”，而是产品定义里写死的硬性要求。断网也得工作——这是产品定位决定的，不是后来加上去的。

边缘与云端的分工模式

维度	边缘	云端
任务	实时推理、本地决策	模型训练、数据分析、远程管理
延迟	< 50ms	200-500ms+
网络依赖	无	必须
模型大小	受限（KB 级）	不受限（GB 级）
更新频率	低频 OTA	持续迭代

模型压缩是边缘部署的关键挑战

将云端训练的大模型部署到边缘设备，需要经过 INT8 量化、模型剪枝、知识蒸馏等压缩技术。例如火眼哨兵的 1D-CNN 时序模型从训练版本压缩到 226K 参数、INT8 量化后仅 268KB，才能在 45 元的 ESP32-S3 MCU 上实时运行。

不同素材中的观点

来自 2026-06-18-woshipm-fireguard-edge-ai-fire-warning：

火眼哨兵团队选择边缘推理而非云端推理，核心理由是”断网也得工作”——这是消防场景的产品定义而非技术偏好。单帧推理延迟 < 50ms，代价是算法重写和模型压缩到 268KB。
“能跑通”和”能交付”是两个产品：Mamba-YOLOv8 推理一帧 180ms（CPU），完全不能上嵌入式，最终用 ONNX Runtime + 静态 INT8 量化才压到 50ms 以内，中间 5 个月是两者之间的距离。

实用信息

适用场景

地下车库、矿井、地铁、船舶等网络不可靠环境
需要毫秒级响应的实时控制场景
隐私敏感的数据处理（数据不出设备）
大规模部署时的带宽成本控制

典型技术栈

MCU 级：ESP32-S3、STM32 + TFLite Micro / ONNX Runtime
边缘 GPU：NVIDIA Jetson Nano/Orin + TensorRT
边缘 AI 框架：TensorFlow Lite、ONNX Runtime、Apache TVM

注意事项

边缘设备算力有限，模型必须经过压缩（量化/剪枝/蒸馏）
固件 OTA 更新机制必须可靠，否则模型迭代无法触达设备
边缘与云端的数据同步策略需要精心设计，避免数据丢失或重复

个人知识库

探索

边缘计算

边缘计算

关键信息

核心特性

低延迟是核心驱动力

离线可用是产品定义而非技术妥协

边缘与云端的分工模式

模型压缩是边缘部署的关键挑战

不同素材中的观点

实用信息

适用场景

典型技术栈

注意事项

相关页面

关系图谱

快速导航

目录

反向链接