语义分割技术详解
语义分割(Semantic Segmentation) 是计算机视觉的核心任务,目标是为图像中的每个像素分配一个类别标签,实现像素级的精确理解。简单来说,就是让计算机"看懂"图像中每个像素是什么物体。
一、核心概念:从分类到分割
任务对比
| 任务类型 | 粒度 | 输出 | 示例 |
| -------- | ------- | ---- | -------------------- |
| **图像分类** | 整张图 | 一个标签 | "这张图片是猫" |
| **目标检测** | 目标框 | 框+标签 | "猫在\[50,60,200,300]" |
| **语义分割** | **像素级** | 像素掩码 | **每个像素**标注为"猫"或"背景" |
关键区别:语义分割不区分同类物体的不同实例(所有"人"像素标为同一类),而 实例分割 会区分"人1"和"人2"