OpenCV图像金字塔详解:原理、实现与应用

一、什么是图像金字塔?

图像金字塔是图像处理中一种重要的多尺度表示方法,它通过对图像进行重复的平滑和降采样(或上采样)操作,生成一系列分辨率逐渐降低(或升高)的图像集合。这种结构形似金字塔,因此得名"图像金字塔"。

图像金字塔在计算机视觉领域有着广泛的应用,包括:

  • 图像融合与无缝拼接
  • 目标检测(如人脸检测)
  • 图像分割
  • 特征提取
  • 图像压缩等

二、图像金字塔的类型

OpenCV中主要支持两种类型的图像金字塔:

1. 高斯金字塔(Gaussian Pyramid)

高斯金字塔是通过不断对图像进行高斯平滑和下采样得到的。每一层图像都是前一层图像经过高斯模糊后,再隔行隔列降采样得到的。

构建过程:

  1. 对当前层图像进行高斯模糊
  2. 删除所有的偶数行和偶数列
  3. 得到的新图像就是金字塔的下一层

2. 拉普拉斯金字塔(Laplacian Pyramid)

拉普拉斯金字塔是由高斯金字塔构建而来的,它保存的是高斯金字塔每一层与其上一层扩展后的差异信息。可以看作是图像的边缘和细节信息。

构建过程:

  1. 对高斯金字塔的某一层图像进行上采样
  2. 用高斯核对上采样后的图像进行卷积(近似扩展)
  3. 计算扩展后的图像与上一层图像的差异
  4. 这个差异图像就是拉普拉斯金字塔的当前层

三、OpenCV中的图像金字塔实现

OpenCV提供了pyrDown()pyrUp()函数来构建高斯金字塔,而拉普拉斯金字塔可以通过高斯金字塔计算得到。

1.1 高斯金字塔实现(下采样)

import cv2
from cv2 import IMREAD_GRAYSCALE'''--------------高斯金字塔操作中的向下采样----------------'''
#先进行高斯滤波
#再删除其偶数行与偶数列,完成一次下采样#  下采样 是一种减小图像尺寸的方法,它通常涉及到降低图像的分辨率,即减少图像中像素的数量,从而使图像看起来更小。
#  上采样 是一种增大图像尺寸的方法,它通过插值和滤波技术来恢复图像的分辨率和细节,通常用于图像放大或者与下采样后的图像进行比较。
#  resize函数  是一种通用的图像尺寸调整方法,它可以按照指定的目标尺寸来缩放图像,不涉及金字塔结构或者特定的滤波操作。# dst = cv2.pyrDown(src [,dst, dstsize [, borderType] ])
# dst:目标图像
# src:原始图像
# dstsize:目标图像的大小face=cv2.imread('face.png',IMREAD_GRAYSCALE)
cv2.imshow('face',face)
cv2.waitKey(0)face_down_1=cv2.pyrDown(face)  #下采样处理
cv2.imshow('down_1',face_down_1)
cv2.waitKey(0)face_down_2=cv2.pyrDown(face_down_1)
cv2.imshow('down_2',face_down_2)
cv2.waitKey(0)face_down_1_up=cv2.pyrUp(face_down_1)
face_down_2_up=cv2.pyrUp(face_down_2)cv2.imshow('down_1_up',face_down_1_up)
cv2.imshow('down_2_up',face_down_2_up)
cv2.waitKey(0)cv2.destroyAllWindows()

1.2 高斯金字塔实现(上采样)

import cv2
from cv2 import IMREAD_GRAYSCALE'''--------------高斯金字塔操作中的向下采样----------------'''
#插值
#高斯滤波#  下采样 是一种减小图像尺寸的方法,它通常涉及到降低图像的分辨率,即减少图像中像素的数量,从而使图像看起来更小。
#  上采样 是一种增大图像尺寸的方法,它通过插值和滤波技术来恢复图像的分辨率和细节,通常用于图像放大或者与下采样后的图像进行比较。
#  resize函数  是一种通用的图像尺寸调整方法,它可以按照指定的目标尺寸来缩放图像,不涉及金字塔结构或者特定的滤波操作。# dst = cv2.pyrDown(src [,dst, dstsize [, borderType] ])
# dst:目标图像
# src:原始图像
# dstsize:目标图像的大小face=cv2.imread('face.png',IMREAD_GRAYSCALE)
cv2.imshow('face',face)
cv2.waitKey(0)face_up_1=cv2.pyrUp(face)
cv2.imshow('up_1',face_up_1)
cv2.waitKey(0)face_up_2=cv2.pyrUp(face_up_1)
cv2.imshow('up_2',face_up_2)
cv2.waitKey(0)face_up_1_down=cv2.pyrDown(face_up_1)
face_up_2_down=cv2.pyrDown(face_up_2)cv2.imshow('up_1_down',face_up_1_down)
cv2.imshow('up_2_down',face_up_2_down)
cv2.waitKey(0)cv2.destroyAllWindows()

2. 拉普拉斯金字塔实现

import cv2'''---------------拉普拉斯金字塔------------------'''#由原图的采样时丢失的信息组成的face=cv2.imread('face.png',cv2.IMREAD_GRAYSCALE)
cv2.imshow('face',face)
cv2.waitKey(0)face_down_1=cv2.pyrDown(face)
face_down_2=cv2.pyrDown(face_down_1)face_up_1=cv2.pyrUp(face)
face_up_2=cv2.pyrUp(face_up_1)face_down_1_up=cv2.pyrUp(face_down_1)
face_down_2_up=cv2.pyrUp(face_down_2)#获取损失信息
L0=face-face_down_1_up
L1=face_down_1-face_down_2_upfuyuan=face_down_1_up+L0cv2.imshow('L0',L0)
cv2.imshow('L1',L1)
cv2.waitKey(0)
cv2.imshow('fuyuan',fuyuan)
cv2.waitKey(0)cv2.destroyAllWindows()

四、图像金字塔的应用实例

1. 图像融合

图像金字塔常用于图像融合,如将两张图像无缝拼接在一起:

def image_blending(img1, img2, mask, levels=6):# 生成高斯金字塔G1 = img1.copy()G2 = img2.copy()GM = mask.copy()gp1 = [G1]gp2 = [G2]gpM = [GM]for i in range(levels):G1 = cv2.pyrDown(G1)G2 = cv2.pyrDown(G2)GM = cv2.pyrDown(GM)gp1.append(G1)gp2.append(G2)gpM.append(GM)# 生成拉普拉斯金字塔lp1 = [gp1[levels-1]]lp2 = [gp2[levels-1]]gpMr = [gpM[levels-1]]for i in range(levels-1, 0, -1):size = (gp1[i-1].shape[1], gp1[i-1].shape[0])L1 = cv2.subtract(gp1[i-1], cv2.pyrUp(gp1[i], dstsize=size))L2 = cv2.subtract(gp2[i-1], cv2.pyrUp(gp2[i], dstsize=size))lp1.append(L1)lp2.append(L2)gpMr.append(gpM[i-1])# 融合LS = []for l1, l2, gm in zip(lp1, lp2, gpMr[::-1]):gm = gm/255.0ls = l1 * gm + l2 * (1.0 - gm)LS.append(ls)# 重建图像ls_ = LS[0]for i in range(1, levels):size = (LS[i].shape[1], LS[i].shape[0])ls_ = cv2.add(cv2.pyrUp(ls_, dstsize=size), LS[i])return ls_# 使用示例
img1 = cv2.imread('image1.jpg')
img2 = cv2.imread('image2.jpg')
mask = cv2.imread('mask.jpg', 0)  # 二值掩模result = image_blending(img1, img2, mask)
cv2.imshow('Blended Image', result)
cv2.waitKey(0)
cv2.destroyAllWindows()

2. 图像超分辨率

虽然图像金字塔主要用于降采样,但结合深度学习等方法,金字塔结构也可以用于图像超分辨率任务。

五、性能优化与注意事项

  1. 金字塔层数选择:金字塔的层数不宜过多,一般不超过6-7层,否则最高层的图像会太小而失去意义。

  2. 边界处理:在进行金字塔操作时,OpenCV会自动处理边界问题,但如果需要自定义实现,需要注意边界条件的处理。

  3. 内存考虑:构建金字塔会生成多幅图像,占用较多内存,在处理大图像时需要注意。

  4. 性能优化:对于实时应用,可以考虑只构建必要的金字塔层级,或者使用ROI(感兴趣区域)来减少计算量。

六、总结

图像金字塔是计算机视觉中一项基础而重要的技术,它通过多尺度表示图像信息,为许多高级视觉任务提供了便利。OpenCV提供了简单易用的金字塔构建函数,使得开发者可以轻松实现各种基于金字塔的算法。掌握图像金字塔的原理和应用,将有助于你解决更复杂的图像处理问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/80769.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

收集飞花令碎片——C语言分支与循环语句(上)

前言 Hello,各位码友,本章将会给大家带来C语言的分支与循环整章串讲,这一张的内容分为基础知识和程序练习两个部分 希望通过这一章能够带大家更好地去掌握C语言的分支与循环语句 大家一起努力吧 C语言分支与循环语句(基础知识) C…

嵌入式硬件篇---TOF|PID

文章目录 前言1. 硬件准备主控芯片ToF模块1.VL53L0X2.TFmini 执行机构:电机舵机其他 2. 硬件连接(1) VL53L0X(IC接口)(2) TFmini(串口通信) 3. ToF模块初始化与数据读取(1) VL53L0X(基于HAL库)(…

PCB设计实践(十二)PCB设计电容选型:功能、材质、规则

在PCB设计中,电容作为基础元件承担着滤波、储能、去耦、耦合等核心功能。其分类与使用规则直接影响电路稳定性、抗干扰能力和信号完整性。本文从工程实践角度系统梳理PCB设计中电容的五大分类、选型规范及布局布线规则,帮助设计者构建科学的电容应用体系…

vue2关闭eslint

在项目根目录下找到 vue.config.js 文件。如果没有该文件,可以直接在项目根目录创建一个。 2. 添加 lintOnSave: false 配置 module.exports {lintOnSave: false };

MyBatis 一对多关联映射在Spring Boot中的XML配置

在Spring Boot中使用MyBatis实现一对多关系时,可以通过XML映射文件来配置。下面我将详细介绍几种实现方式。 基本概念 一对多关系指的是一个实体对象包含多个子对象集合的情况,例如: 一个部门有多个员工一个订单有多个订单项一个博客有多个…

基于Stable Diffusion XL模型进行文本生成图像的训练

基于Stable Diffusion XL模型进行文本生成图像的训练 flyfish export MODEL_NAME"stabilityai/stable-diffusion-xl-base-1.0" export VAE_NAME"madebyollin/sdxl-vae-fp16-fix" export DATASET_NAME"lambdalabs/naruto-blip-captions"acceler…

基于React的高德地图api教程001:初始化地图

文章目录 1、初始化地图1.1 创建react项目1.2 可视化地图1.3 设置卫星地图1.4 添加开关开启3D地图1.5 代码下载1、初始化地图 1.1 创建react项目 创建geodeapi项目: npx create-react-app gaodeapi安装高德地图包: npm install @amap/amap-jsapi-loader1.2 可视化地图 在…

uniapp使用npm下载

uniapp的项目在使用HBuilder X创建时是不会有node_modules文件夹的,如下图所示: 但是uni-app不管基于哪个框架,它内部一定是有node.js的,否则没有办法去实现框架层面的一些东西,只是说它略微有点差异。具体差异表现在…

轻量在线工具箱系统源码 附教程

源码介绍 轻量在线工具箱系统源码,直接扔服务器 修改config/config.php文件里面的数据库 后台账号admin 密码admin123 本工具是AI写的 所以工具均是第三方接口直接写的。 需要加工具直接自己找接口写好扔到goju目录 后台自动读取 效果预览 源码获取 轻量在线工具箱系统源…

图解gpt之Seq2Seq架构与序列到序列模型

今天深入探讨如何构建更强大的序列到序列模型,特别是Seq2Seq架构。序列到序列模型,顾名思义,它的核心任务就是将一个序列映射到另一个序列。这个序列可以是文本,也可以是其他符号序列。最早,人们尝试用一个单一的RNN来…

mac M2能安装的虚拟机和linux系统系统

能适配MAC M2芯片的虚拟机下Linux系统的搭建全是深坑,目前网上的资料能搜到的都是错误的,自己整理并分享给坑友们~ 网上搜索到的推荐安装的改造过的centos7也无法进行yum操作,我这边建议安装centos8 VMware Fusion下载地址: htt…

「国产嵌入式仿真平台:高精度虚实融合如何终结Proteus时代?」——从教学实验到低空经济,揭秘新一代AI赋能的产业级教学工具

引言:从Proteus到国产平台的范式革新 在高校嵌入式实验教学中,仿真工具的选择直接影响学生的工程能力培养与创新思维发展。长期以来,Proteus作为经典工具占据主导地位,但其设计理念已难以满足现代复杂系统教学与国产化技术需求。…

【Linux】在Arm服务器源码编译onnxruntime-gpu的whl

服务器信息: aarch64架构 ubuntu20.04 nvidia T4卡 编译onnxruntime-gpu前置条件: 已经安装合适的cuda已经安装合适的cudnn已经安装合适的cmake 源码编译onnxruntime-gpu的步骤 1. 下载源码 git clone --recursive https://github.com/microsoft/o…

前端上传el-upload、原生input本地文件pdf格式(纯前端预览本地文件不走后端接口)

前端实现本地文件上传与预览(PDF格式展示)不走后端接口 实现步骤 第一步:文件选择 使用前端原生input上传本地文件,或者是el-upload组件实现文件选择功能,核心在于文件渲染处理。(input只不过可以自定义样…

Python 数据分析与可视化:开启数据洞察之旅(5/10)

一、Python 数据分析与可视化简介 在当今数字化时代,数据就像一座蕴藏无限价值的宝藏,等待着我们去挖掘和探索。而 Python,作为数据科学领域的明星语言,凭借其丰富的库和强大的功能,成为了开启这座宝藏的关键钥匙&…

C语言学习记录——深入理解指针(4)

OK,这一篇主要是讲我学习的3种指针类型。 正文开始: 一.字符指针 所谓字符指针,顾名思义就是指向字符的指针。一般写作 " char* " 直接来说说它的使用方法吧: (1)一般使用情况: i…

springboot3+vue3融合项目实战-大事件文章管理系统获取用户详细信息-ThreadLocal优化

一句话本质 为每个线程创建独立的变量副本,实现多线程环境下数据的安全隔离(线程操作自己的副本,互不影响)。 关键解读: 核心机制 • 同一个 ThreadLocal 对象(如示意图中的红色区域 tl)被多个线…

Nacos源码—8.Nacos升级gRPC分析六

大纲 7.服务端对服务实例进行健康检查 8.服务下线如何注销注册表和客户端等信息 9.事件驱动架构源码分析 一.处理ClientChangedEvent事件 也就是同步数据到集群节点: public class DistroClientDataProcessor extends SmartSubscriber implements DistroDataSt…

设计杂谈-工厂模式

“工厂”模式在各种框架中非常常见,包括 MyBatis,它是一种创建对象的设计模式。使用工厂模式有很多好处,尤其是在复杂的框架中,它可以带来更好的灵活性、可维护性和可配置性。 让我们以 MyBatis 为例,来理解工厂模式及…

AI与IoT携手,精准农业未来已来

AIoT:农业领域的变革先锋 在科技飞速发展的当下,人工智能(AI)与物联网(IoT)的融合 ——AIoT,正逐渐成为推动各行业变革的关键力量,农业领域也不例外。AIoT 技术通过将 AI 的智能分析…