【IPMV】图像处理与机器视觉
本系列为2025年同济大学自动化专业**图像处理与机器视觉**课程笔记
Lecturer: Rui Fan、Yanchao Dong
Lec0 Course Description
Lec3 Perspective Transformation
Lec7 Image Filtering
Lec8 Image Pyramid
持续更新中
文章目录
- 【IPMV】图像处理与机器视觉
- Image Pyramid 图像金字塔
- 概述
- Pyramids
- Image Interpolation 图像插值
- Repeated linear interpolation 重复线性插值
- Polynormial Fit 多项式拟合
- Down-sampling 降采样
- Gaussian Pyramids 高斯金字塔
- Image Down-sampling v.s. Pooling 降采样 v.s. 池化
- Up-sampling 上采样
- 应用:Template Matching 模板匹配
- 总结
Image Pyramid 图像金字塔
概述
本节主要解决:如何改变图像分辨率以便进一步处理
首先介绍用于改变分辨率的图像金字塔,上采样(插值)和下采样,
接下来介绍上采样的线性插值方法,再介绍降采样和上采样;
最后简要介绍图像金字塔的应用——模板匹配
- Pyramids
- Image Pyramid
- Image Interpolation
- Image Down-sampling
- Image Up-sampling
Pyramids
图像金字塔是图像多尺度表达的一种,是一种以多分辨率来解释图像的有效但概念简单的结构。
通常包括上采样(up-sampling operation
)和降采样(down-sampling operation
)。
- 大图像,不断降采样,得到小图像
- 小图像,不断上采样,得到大图像
本节我们主要介绍高斯金字塔(Gaussian pyramid)
Image Interpolation 图像插值
图像插值是上采样的主要手段,给定图片中相邻的4个点,如何用1个点去代替。假如我们想得到未知函数 f f f 在点 P = ( x , y ) P = (x,y) P=(x,y) 的值,假设我们已知函数 f f f 在 Q 11 = ( x 1 , y 1 ) , Q 12 = ( x 1 , y 2 ) , Q 21 = ( x 2 , y 1 ) , Q 22 = ( x 2 , y 2 ) Q_{11}=(x_1 , y_1), Q_{12}=(x_1 , y_2), Q_{21}=(x_2 , y_1), Q_{22}=(x_2 , y_2) Q11=(x1,y1),Q12=(x1,y2),Q21=(x2,y1),Q22=(x2,y2) 四个点的值。
此处介绍两种计算方法,重复线性插值(Repeated linear interpolation
) 、多项式拟合方法(Polynomial Fit
)
Repeated linear interpolation 重复线性插值
双线性插值,又称为双线性内插。其核心思想:在两个方向分别进行一次线性插值
首先在 x 方向进行线性插值,得到
f ( x , y 1 ) ≈ x 2 − x x 2 − x 1 f ( Q 11 ) + x − x 1 x 2 − x 1 f ( Q 21 ) , f ( x , y 2 ) ≈ x 2 − x x 2 − x 1 f ( Q 12 ) + x − x 1 x 2 − x 1 f ( Q 22 ) . {\displaystyle {\begin{aligned}f(x,y_{1})&\approx {\frac {x_{2}-x}{x_{2}-x_{1}}}f(Q_{11})+{\frac {x-x_{1}}{x_{2}-x_{1}}}f(Q_{21}),\\f(x,y_{2})&\approx {\frac {x_{2}-x}{x_{2}-x_{1}}}f(Q_{12})+{\frac {x-x_{1}}{x_{2}-x_{1}}}f(Q_{22}).\end{aligned}}} f(x,y1)f(x,y2)≈x2−x1x2−xf(Q11)+x2−x1x−x1f(Q21