目标检测任务
目标检测定位图像中物体的位置(边界框)和类别。比分类更复杂:需要位置回归+类别预测。应用场景:自动驾驶、安防监控、工业检测。
检测方法分类
两阶段检测器
先生成候选区域,再分类和回归。代表:R-CNN系列(Fast R-CNN、Faster R-CNN)。精度高但速度慢。
单阶段检测器
直接从图像预测框和类别。代表:YOLO、SSD、RetinaNet。速度快,实时性好。
YOLO演进之路
- YOLOv1:首个单阶段检测器,开创性工作
- YOLOv2/YOLO9000:BatchNorm、多尺度训练
- YOLOv3:多尺度预测、Darknet-53 backbone
- YOLOv4/v5:训练技巧集成、工程优化
- YOLOv8:Anchor-free设计、性能全面提升
YOLO核心思想
将检测视为回归问题:图像划分网格,每个网格预测边界框和类别。端到端训练,推理速度快。
选择指南
实时应用选YOLO;高精度选两阶段;边缘设备用轻量版本(YOLO-Nano)。
YOLO以速度著称,从v1到v8持续精进,成为检测首选。