
最近在研究自动驾驶视觉语义地图构建,因为要使用到语义分割技术,趁此机会学习了百度飞桨的图像分割课程,课程蛮好的,收获也蛮大的。
课程地址:https://aistudio.baidu.com/aistudio/course/introduce/1767
1. 课程简要介绍
首先给出了图像分割的定义,如下面两张图所示,本质是对图像进行像素级分类。
![]() | ![]() |
下面是课程安排,本次课程总共有7节课,理论学习主要集中在前6节,最后一节是课程总结与前沿技术介绍。前面6节课安排如下:
- 在本次课程中,会学习到
FCN、U-Net、PSPNet、DeepLabv1-3等算法,这是课程的主要学习内容。 - 后面两节课会介绍
图分割和实例分割经典算法。
![]() | ![]() | ![]() |
2. 语义分割初探
根据任务和数据类型的不同,图像分割可以分为以下几类:
- semantic segmentation(
语义分割):给图像中每个像素进行分类 - instance segmentation(
实例分割):给每个框中的物体对应像素进行分类,不同的instance有不同的mask - panoptic segmentation(
全场景分割):每个框中的物体对应像素进行分类 + 背景像素分类
此外,还有视频目标分割与视频实例分割。
| semantic / instance / panoptic segmentation | Video Object Segmentation | Video Instance Segmentation |
|---|---|---|
![]() | ![]() | ![]() |
3. 深度学习分割算法
下面是语义分割算法的基本流程,输入为图像与标签,输出为分类结果(与输入图像大小相同的单通道图)。

语义分割常用性能指标主要有两种:mIoU和mAcc。







