TinyML

Tiny Machine Learning——在微控制器（MCU）等资源极度受限的设备上运行机器学习模型的技术，模型大小通常在 KB 级别。

关键信息

属性	值
全称	Tiny Machine Learning
领域	嵌入式 AI / 边缘智能
模型规模	通常 < 1MB，典型在 100KB-500KB
典型硬件	ESP32、STM32、Arduino Nano 33 BLE
核心挑战	内存限制、算力限制、功耗限制

核心特性

从”不可能”到”刚刚好”

传统观点认为机器学习需要 GPU 集群和 GB 级内存，TinyML 打破了这个假设。通过模型压缩（INT8 量化、剪枝、知识蒸馏）和专用推理引擎（TFLite Micro、ONNX Runtime Micro），一个 226K 参数的 1D-CNN 时序模型可以压缩到 268KB，在 45 元的 ESP32-S3 MCU 上实现 < 50ms 的实时推理。

时序模型是 TinyML 的杀手级应用

在工业监测、环境感知等领域，传感器产生的数据天然是时间序列。TinyML 的时序模型（1D-CNN、TCN、LSTM 压缩版）可以从滑动窗口数据中提取模式——例如锂电池热失控检测中，模型吃 30 秒滑动窗口的温度 + 一阶差分 + 二阶差分 + 归一化四通道特征，输出异常概率。

量化是核心压缩技术

量化方式	精度损失	压缩比	典型场景
FP32 → FP16	极小	2x	云端推理加速
FP32 → INT8	可控	4x	边缘设备部署
FP32 → INT4	较大	8x	极端资源受限

INT8 量化是 TinyML 的甜点——4 倍压缩、精度损失可控、大多数 MCU 有 INT8 硬件加速。

不同素材中的观点

来自 2026-06-18-woshipm-fireguard-edge-ai-fire-warning：

火眼哨兵团队在 ESP32-S3（45 元 MCU）上跑 1D-CNN 时序模型，226K 参数、INT8 量化后 268KB，30 秒滑动窗口推理异常概率。模型虽小但测试集 Acc 99.94%、Recall 99.81%——关键不在模型大不大，在于特征工程做得好不好（温升二阶导数是核心特征）。
从 Mamba-YOLOv8 的 180ms/帧（CPU）到 50ms/帧的压缩路径：ONNX Runtime + 静态 INT8 量化，中间经历了 TFLite Micro 算子不支持的踩坑。TinyML 的工程化落地远比理论复杂。

实用信息

入门路径

学习 TensorFlow Lite for Microcontrollers 或 Edge Impulse 平台
从简单分类任务开始（加速度计手势识别）
掌握 INT8 量化流程（训练 → 量化感知训练 → 导出 TFLite → 部署）
了解目标硬件的内存和算力约束

关键工具

TensorFlow Lite Micro：Google 官方 TinyML 推理引擎
ONNX Runtime：微软跨平台推理引擎，支持 INT8 量化
Edge Impulse：端到端 TinyML 开发平台（数据采集→训练→部署）
STM32Cube.AI：ST 官方 MCU 模型部署工具

注意事项

训练数据的质量比模型架构更重要——仿真数据需要包含硬负样本
MCU 的 Flash 和 RAM 是硬约束，部署前必须验证模型 fits
量化后精度下降是必然的，需要在目标任务上重新验证
OTA 更新机制是 TinyML 产品化的必备能力

个人知识库

探索

TinyML

TinyML

关键信息

核心特性

从”不可能”到”刚刚好”

时序模型是 TinyML 的杀手级应用

量化是核心压缩技术

不同素材中的观点

实用信息

入门路径

关键工具

注意事项

相关页面

关系图谱

快速导航

目录

反向链接