TinyML

Tiny Machine Learning——在微控制器(MCU)等资源极度受限的设备上运行机器学习模型的技术,模型大小通常在 KB 级别。

关键信息

属性
全称Tiny Machine Learning
领域嵌入式 AI / 边缘智能
模型规模通常 < 1MB,典型在 100KB-500KB
典型硬件ESP32、STM32、Arduino Nano 33 BLE
核心挑战内存限制、算力限制、功耗限制

核心特性

从”不可能”到”刚刚好”

传统观点认为机器学习需要 GPU 集群和 GB 级内存,TinyML 打破了这个假设。通过模型压缩(INT8 量化、剪枝、知识蒸馏)和专用推理引擎(TFLite Micro、ONNX Runtime Micro),一个 226K 参数的 1D-CNN 时序模型可以压缩到 268KB,在 45 元的 ESP32-S3 MCU 上实现 < 50ms 的实时推理。

时序模型是 TinyML 的杀手级应用

在工业监测、环境感知等领域,传感器产生的数据天然是时间序列。TinyML 的时序模型(1D-CNN、TCN、LSTM 压缩版)可以从滑动窗口数据中提取模式——例如锂电池热失控检测中,模型吃 30 秒滑动窗口的温度 + 一阶差分 + 二阶差分 + 归一化四通道特征,输出异常概率。

量化是核心压缩技术

量化方式精度损失压缩比典型场景
FP32 → FP16极小2x云端推理加速
FP32 → INT8可控4x边缘设备部署
FP32 → INT4较大8x极端资源受限

INT8 量化是 TinyML 的甜点——4 倍压缩、精度损失可控、大多数 MCU 有 INT8 硬件加速。

不同素材中的观点

来自 2026-06-18-woshipm-fireguard-edge-ai-fire-warning

  • 火眼哨兵团队在 ESP32-S3(45 元 MCU)上跑 1D-CNN 时序模型,226K 参数、INT8 量化后 268KB,30 秒滑动窗口推理异常概率。模型虽小但测试集 Acc 99.94%、Recall 99.81%——关键不在模型大不大,在于特征工程做得好不好(温升二阶导数是核心特征)。
  • 从 Mamba-YOLOv8 的 180ms/帧(CPU)到 50ms/帧的压缩路径:ONNX Runtime + 静态 INT8 量化,中间经历了 TFLite Micro 算子不支持的踩坑。TinyML 的工程化落地远比理论复杂。

实用信息

入门路径

  1. 学习 TensorFlow Lite for Microcontrollers 或 Edge Impulse 平台
  2. 从简单分类任务开始(加速度计手势识别)
  3. 掌握 INT8 量化流程(训练 → 量化感知训练 → 导出 TFLite → 部署)
  4. 了解目标硬件的内存和算力约束

关键工具

  • TensorFlow Lite Micro:Google 官方 TinyML 推理引擎
  • ONNX Runtime:微软跨平台推理引擎,支持 INT8 量化
  • Edge Impulse:端到端 TinyML 开发平台(数据采集→训练→部署)
  • STM32Cube.AI:ST 官方 MCU 模型部署工具

注意事项

  • 训练数据的质量比模型架构更重要——仿真数据需要包含硬负样本
  • MCU 的 Flash 和 RAM 是硬约束,部署前必须验证模型 fits
  • 量化后精度下降是必然的,需要在目标任务上重新验证
  • OTA 更新机制是 TinyML 产品化的必备能力

相关页面

  • 边缘计算 — TinyML 的上位概念,更广泛的边缘计算范式
  • 热失控检测 — TinyML 在安全监测领域的典型应用
  • 火眼哨兵 — TinyML 从训练到部署的完整工程实践