[python-opencv] PNG 裁切物体

拿到一组图PNG的图,边缘有点太宽了,需要裁切一下,为了这个需求,简单复习一下基本语法。

1.  读取PNG的4个通道

image = cv.imread(image_path, cv.IMREAD_UNCHANGED)

参数说明

IMREAD_UNCHANGED            = -1 

返回的数据带有alpha通道(R,G,B,A 四个通道),否则没有alpha通道

IMREAD_GRAYSCALE            = 0  

将图像转换为单通道灰度图像

IMREAD_COLOR                = 1  

将图像转换成3通道BGR彩色图像

IMREAD_ANYDEPTH             = 2  

在输入具有相应深度时返回16位/32位图像,否则将其转换为8位

IMREAD_ANYCOLOR             = 4  

图像可能以任何颜色格式读取

IMREAD_LOAD_GDAL            = 8 

 使用gdal驱动程序加载图像

IMREAD_REDUCED_GRAYSCALE_2  = 16

 将图像转换为单通道灰度图像且图像大小减少1/2

IMREAD_REDUCED_COLOR_2      = 17 

将图像转换为3通道BGR彩色图像且图像大小减少1/2

IMREAD_REDUCED_GRAYSCALE_4  = 32

 将图像转换为单通道灰度图像且图像大小减少1/4

IMREAD_REDUCED_COLOR_4      = 33 

将图像转换为3通道BGR彩色图像且图像大小减少1/4

IMREAD_REDUCED_GRAYSCALE_8  = 64

 将图像转换为单通道灰度图像且图像大小减少1/8

IMREAD_REDUCED_COLOR_8      = 65 

将图像转换为3通道BGR彩色图像且图像大小减少1/8

IMREAD_IGNORE_ORIENTATION   = 128

不会根据EXIF的方向标志旋转图像

2. 遍历文件夹获取每个图像文件:

def traverse_folder(folder_path):for root, dirs, files in os.walk(folder_path):for file in files:# 文件的绝对路径file_path = os.path.join(root, file)print(file_path)

3. 找到PNG中物体的ROI:

def findROI(img_path):image = cv.imread(img_path)gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)# 获取图像的宽高通道height, width, channels = image.shape# 进行边缘检测edges = cv.Canny(gray, 50, 255)xmin = width - 1ymin = height - 1xmax = 0ymax = 0for i in range(width):for j in range(height):if edges[j, i] != 0:if xmin > i:xmin = iif xmax < i:xmax = iif ymin > j:ymin = jif ymax < j:ymax = jprint("width : ", xmax - xmin)print("height : ", ymax - ymin)return xmin,xmax,ymin,ymax

4. 遍历文件夹将jpg转PNG


def traverse_folder_convertJPGtoPNG(folder_path, output_path):for root, dirs, files in os.walk(folder_path):for file in files:# 文件的绝对路径file_path = os.path.join(root, file)print(file_path)# 获取没有后缀的文件名filename_without_extension = os.path.splitext(file)[0]print(filename_without_extension)#print(output_path + '/' + filename_without_extension + '.png')jpg_to_png(file_path, output_path + '/' + filename_without_extension + '.png')def jpg_to_png(jpg_path, png_path):img = Image.open(jpg_path)  # 打开jpg文件img.save(png_path, 'PNG')  # 保存为png文件

5. 按照指定ROI图像获取图像区域并保存


def cropbysize_and_save_image(image_path, output_path, outputWidth,outputHeight):image = cv.imread(image_path, cv.IMREAD_UNCHANGED)height, width, channels = image.shapeprint("图像宽度:", width)print("图像高度:", height)print("图像频道:", channels)ymin=math.floor(height*0.5-outputHeight*0.5)ymax=math.ceil(height*0.5+outputHeight*0.5)xmin=math.floor(width*0.5-outputWidth*0.5)xmax=math.ceil(width*0.5+outputWidth*0.5)cropped_image = image[ymin:ymax, xmin:xmax]# 保存为png文件cv.imwrite(output_path, cropped_image, [int(cv.IMWRITE_PNG_STRATEGY_DEFAULT), 9])  

6. 按照问题所在ROI获取图像区域

def crop_and_save_image(image_path, output_path):image = cv.imread(image_path, cv.IMREAD_UNCHANGED)gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)height, width, channels = image.shapeedges = cv.Canny(gray, 50, 255)print(edges)xmin = width - 1ymin = height - 1xmax = 0ymax = 0for i in range(width):for j in range(height):if edges[j,i] != 0:if xmin > i:xmin = iif xmax < i:xmax = iif ymin > j:ymin = jif ymax < j:ymax = jcropped_image = image[ymin-2:ymax+2, xmin-2:xmax+2]cv.imwrite(output_path,cropped_image, [int(cv.IMWRITE_PNG_STRATEGY_DEFAULT), 9]) 

Imwrite参数说明

IMWRITE_JPEG_QUALITY

对于JPEG,它可以是从0到100的质量(越高越好)。默认值是95。

IMWRITE_JPEG_PROGRESSIVE

启用JPEG功能,0或1,默认为False。

IMWRITE_JPEG_OPTIMIZE

启用JPEG功能,0或1,默认为False。

IMWRITE_JPEG_RST_INTERVAL

JPEG重新启动间隔,0 - 65535,默认为0 - 不重新启动。

IMWRITE_JPEG_LUMA_QUALITY

单独的亮度质量等级,0 - 100,默认为0 - 不使用。

IMWRITE_JPEG_CHROMA_QUALITY

独立的色度质量等级,0 - 100,默认为0 - 不使用。

IMWRITE_PNG_COMPRESSION

对于PNG,它可以是从0到9的压缩级别。较高的值意味着较小的尺寸和较长的压缩时间。默认值是3。

IMWRITE_PNG_STRATEGY

cv :: ImwritePNGFlags之一,默认为IMWRITE_PNG_STRATEGY_DEFAULT。

IMWRITE_PNG_BILEVEL

二进制级PNG,0或1,默认为0。

IMWRITE_PXM_BINARY

对于PPM,PGM或PBM,它可以是二进制格式标志,0或1.默认值为1。

IMWRITE_WEBP_QUALITY

对于WEBP,它可以是从1到100的质量(越高越好)。默认情况下(没有任何参数),质量超过100的情况下使用无损压缩。

IMWRITE_PAM_TUPLETYPE

对于PAM,将TUPLETYPE字段设置为为格式定义的相应字符串值。

IMWRITE_TIFF_RESUNIT

 对于TIFF,用于指定要设置的DPI分辨率单位; 请参阅libtiff文档以获取有效值。

IMWRITE_TIFF_XDPI

对于TIFF,用于指定X方向DPI。

IMWRITE_TIFF_YDPI

对于TIFF,用于指定Y方向DPI。

IMWRITE_TIFF_COMPRESSION

 对于TIFF,用于指定图像压缩方案。请参阅libtiff以获取与压缩格式对应的整数常量。注意,对于深度为CV_32F的图像,仅使用libtiff的SGILOG压缩方案。对于其他支持的深度,可以通过此标志指定压缩方案; LZW压缩是默认值。

IMWRITE_JPEG2000_COMPRESSION_X1000

对于JPEG2000,用于指定目标压缩率(乘以1000)。该值可以是0到1000.默认值是1000

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/672129.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

3、生成式 AI 如何帮助您改进数据可视化图表

生成式 AI 如何帮助您改进数据可视化图表 使用生成式 AI 加速和增强数据可视化。 图像来源:DALLE 3 5 个关键要点: 数据可视化图表的基本结构使用 Python Altair 构建数据可视化图表使用 GitHub Copilot 加快图表生成速度使用 ChatGPT 为您的图表生成相关内容使用 DALL-E 将…

[BUUCTF]-PWN:wustctf2020_easyfast解析

又是堆题&#xff0c;查看保护 再看ida 大致就是alloc创建堆块&#xff0c;free释放堆块&#xff0c;fill填充堆块&#xff0c;以及一个getshell的函数&#xff0c;但要满足条件。 值得注意的是free函数没有清空堆块指针 所以可以用double free 有两种解法 解法一&#xff0…

【Linux】打包压缩跨系统/网络传输文件常用指令完结

Hello everybody!在今天的文章中我会把剩下的3-4个常用指令讲完&#xff0c;然后开始权限的讲解。那废话不多说&#xff0c;咱们直接进入正题&#xff01; 1.zip/unzip&tar命令 1.zip/unzip 在windows系统中&#xff0c;经常见到带有zip后缀的文件。那个东西就是压缩包。…

杭州融资融券利率一般最低是4.5%,两融有哪些核心注意事项?

融资融券利率行情 使用融资融券账户的投资者越来越多&#xff0c;对于准备开两融和想换两融券商的投资者来说&#xff0c;最关心的就是两融利率以及开两融或者换券商的便捷程度了。 目前市场上最低的融资融券利率是4.5%~5%&#xff0c;普遍的两融利率一般在5%-6.5%&#xff0…

C++STL模板之——list(简化源码,模拟源码)

众所周知&#xff0c;C给我们底层搬砖人提供了很多便捷的数据结构&#xff0c;让我们能偶尔偷懒&#xff0c;list就是其中之一&#xff0c;现在让我们来了解一下它吧 目录 一&#xff0c;原理 1&#xff09;底层大致结构 2&#xff09;迭代器 3&#xff09;模板 二&#…

龙芯安装使用搜狗输入法

CPU&#xff1a;龙芯3A6000 操作系统&#xff1a;Loongnix 桌面主题&#xff1a;Cartoon 龙芯系统切换输入法的按键一般为&#xff1a;Ctrl空格。 1 安装搜狗输入法 进入Loongnix系统自带的龙芯应用合作社&#xff0c;寻找搜狗输入法&#xff0c;点击安装。 按下Ctrl空格&…

计算机网络——网络

计算机网络——网络 小程一言专栏链接: [link](http://t.csdnimg.cn/ZUTXU)前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家&#xff0c; [跳转到网站](https://www.captainbed.cn/qianqiu) 无线网络和移动网…

用HTML5 + JavaScript实现下雪效果

用HTML5 JavaScript实现下雪效果 <canvas>是一个可以使用脚本 (通常为JavaScript) 来绘制图形的 HTML 元素。 <canvas> 标签/元素只是图形容器&#xff0c;必须使用脚本来绘制图形。 HTML5 canvas 图形标签基础https://blog.csdn.net/cnds123/article/details/…

ArcGIS的UTM与高斯-克吕格投影分带要点总结

UTM&#xff08;通用横轴墨卡托投影、等角横轴割椭圆柱投影&#xff09;投影分带投影要点&#xff1a; 1&#xff09;UTM投影采用6度分带 2&#xff09;可根据公式计算&#xff0c;带数&#xff08;经度整数位/6&#xff09;的整数部分31 3&#xff09;北半球地区&#xff0…

蓝桥杯Web应用开发-CSS3 新特性

CSS3 新特性 专栏持续更新中 在前面我们已经学习了元素选择器、id 选择器和类选择器&#xff0c;我们可以通过标签名、id 名、类名给指定元素设置样式。 现在我们继续选择器之旅&#xff0c;学习 CSS3 中新增的三类选择器&#xff0c;分别是&#xff1a; • 属性选择器 • 子…

STM32搭建开发环境

常用开发工具简介 集成开发环境 MDK&#xff1a;全名RealViewMDK&#xff0c;是Keil公司&#xff08;已被ARM收购的&#xff09;一款集成开发环境&#xff0c;界面美观&#xff0c;简单易用&#xff0c;是STM32最常用的集成开发环境EWARM&#xff1a;IAR公司的一款集成开发环…

出现 message: “Request method ‘POST‘ not supported“ 解决方法

目录 1. 问题所示2. 原理分析3. 解决方法1. 问题所示 在执行某个服务器的时候出现如下提示: error: "Method Not Allowed" message: "Request method POST not supported" path: "/oauth/logout" status: 405 timestamp: "2024-02-05 23…

洛谷_P1464 Function_python写法

目录 1.错误解法 2.学习记忆化搜索算法 2.1简介 2.2案例学习 3.解法 4.总结 1.错误解法 a 0 b 0 c 0 def w(a,b,c):if a<0 or b<0 or c<0:return 1elif a>20 or b>20 or c>20:return w(20,20,20)elif a<b and b<c:return w(a-1,b,c) w(a-1,…

Linux命令stress模拟系统负载

stress 是一个在 Linux 下用于模拟系统负载的命令行工具&#xff0c;它可以帮助你测试系统的稳定性以及对系统的负载行为进行评估。下面是 stress 命令的详细使用方法&#xff1a; 安装 stress 在大多数 Linux 发行版中&#xff0c;stress 工具通常不是默认安装的 debian系 …

Vue源码系列讲解——变化侦测篇【下】(Array的变化侦测)

目录 1. 前言 2. 在哪里收集依赖 3. 使Array型数据可观测 3.1 思路分析 3.2 数组方法拦截器 3.3 使用拦截器 4. 再谈依赖收集 4.1 把依赖收集到哪里 4.2 如何收集依赖 4.3 如何通知依赖 5. 深度侦测 6. 数组新增元素的侦测 7. 不足之处 8. 总结 1. 前言 上一篇文…

Angular学习第三天--问题记录

问题一、 1.问题&#xff1a; An unhandled exception occurred: Unexpected token ?? See "C:\Users\22895\AppData\Local\Temp\ng-D60bgy\angular-errors.log" for further details. 2.原因&#xff1a; node版本过低&#xff0c;项目中angular是17&#xff0c;而…

uniapp的api用法大全

页面生命周期API uniApp中的页面生命周期API可以帮助开发者在页面的不同生命周期中执行相应的操作。常用的页面生命周期API包括&#xff1a;onLoad、onShow、onReady、onHide、onUnload等。其中&#xff0c;onLoad在页面加载时触发&#xff0c;onShow在页面显示时触发&#xf…

神经网络 | CNN 与 RNN——深度学习主力军

Hi&#xff0c;大家好&#xff0c;我是半亩花海。本文主要将卷积神经网络&#xff08;CNN&#xff09;和循环神经网络&#xff08;RNN&#xff09;这两个深度学习主力军进行对比。我们知道&#xff0c;从应用方面上来看&#xff0c;CNN 用于图像识别较多&#xff0c;而 RNN 用于…

centos7.9 安装rabbitmq 3.6.15 集群

安装依赖 yum -y install make gcc gcc-c kernel-devel m4 ncurses-devel libxml2-utils libxml2 \ libxslt openssl-devel unixODBC unixODBC-devel unixODBC-bin gtk2 fop wxWidgets-devel wxBaseln -s /usr/bin/wx-config-3.0 /usr/bin/wx-config安装erlang mkdir /opt/er…

计算机网络(第六版)复习提纲26

6 TCP可靠传输的实现 A 以字节为单位的滑动窗口 1 发送窗口 ①发送窗口一定不能超过接收窗口的数值 ②发送窗口后沿后边表示已经发送并确认&#xff0c;后沿只允许前移或不动 ③发送窗口前沿前面表示不可发送&#xff0c;前沿允许不动或前移&#xff0c;也有可能向后收缩&#…