遂昌赶街网站天津建设银行公积金缴费网站

news/2025/9/23 19:58:39/文章来源:
遂昌赶街网站,天津建设银行公积金缴费网站,公司备案证查询网站查询,博采网络科技因工作中的某些奇葩要求#xff0c;需要将PDF文件的每页内容转存成按顺序编号的图片。用第三方软件或者在线转换也可以#xff0c;但批量操作还是Python方便#xff0c;所谓搞定办公自动化#xff0c;Python出山#xff0c;一统天下#xff1b;Python出征#xff0c;寸草…因工作中的某些奇葩要求需要将PDF文件的每页内容转存成按顺序编号的图片。用第三方软件或者在线转换也可以但批量操作还是Python方便所谓搞定办公自动化Python出山一统天下Python出征寸草不生~ O(∩_∩)O 不过这个需要用到PyMuPDF库电脑运行cmd输入“pip install PyMuPDF”安装即可。安装后通过import fitz导入模块。等等为什么安装的是PyMuPDF导入的是fitz俺PyMuPDF就是这么任性怎么的爱用不用哈哈开个玩笑。其实是因为PyMuPDF曾用名fitz-python所以只是fitz换了个马甲而已呵呵。 这里先导入fitz库用于将PDF文件的页面提取成像素信息图片。再导入glob库用于获取后缀为.pdf的文件的文件名。os库可新建文件夹。 #批量将PDF文件转为图片 import fitz import glob import osimage_path 图片\\ #存放图片的文件夹 PDFfiles glob.glob(PDF文件\\*.pdf) #获取所有pdf文件的文件名 for PDFfile in PDFfiles: #遍历所有PDF文件PDFdoc fitz.open(PDFfile) #读取PDF文件folder_name PDFfile.split(\\)[-1].split(.)[0] #按源文件名新建文件夹for pg in range(PDFdoc.pageCount): #根据PDF的页数,按页提取图片 page PDFdoc[pg]#增强图片分辨率zoom_x 3 #水平方向zoom_y 3 #垂直方向mat fitz.Matrix(zoom_x, zoom_y) pix page.getPixmap(matrixmat) #按原PDF名称新建文件夹并按顺序保存图片if not os.path.exists(image_pathfolder_name):#判断文件夹是否已存在os.makedirs(image_pathfolder_name)#不存在则新建存在就跳过这行pix.writeImage(image_pathfolder_name \\{}.png.format(str(pg1))) #按PDF中的页面顺序命名并保存图片以上我们先将所有待处理的PDF文件放入“PDF文件夹”然后通过glob.glob(PDF文件\\*.pdf)搜索并抓取所有以.pdf为后缀的文件并存入变量PDFfiles中。结果如下所示 PDFfiles[‘PDF文件\6S稽查问题.pdf’, ‘PDF文件\收货记录.pdf’] 然后遍历PDFfiles中的所有PDF文件使用fitz.open()读取。fitz.open()用于创建PDF文件中页面的像素映射(pixel maps)即用像素来表示页面信息。然后按PDF文件名命名一个新的文件夹以便储存图片。比如给“收货记录.pdf”文件建一个名字为“收货记录”的文件夹专门储存关于它的页面的图片。随后用for循环根据PDF的页数按页提取图片。将每页的信息存入page变量它的type 是fitz.fitz.Page即一页像素文件。为了让图片看起来更清晰需要增强图片的分辨率设定图片水平及垂直方向的增强倍数传入Matrix。Matrix用于提升即将保存的图片的分辨率分辨率的提升倍数为zoom_x与zoom_y的乘积。倍数越大图片越清晰当然占用空间也越大。这个参数可根据实际要求调整。然后将Matrix存入mat传入getPixmap()。getPixmap()用于控制图片分辨率、色域比如生成灰度图像或带有减色方案的图像、透明度、旋转、镜像、移位、剪切等。由于其它都不需要专门设定所以只增强其分辨率。 一页图片处理好后就需要保存图片了。先通过os.path.exists判断一下需要的文件夹是否存在若不存在就通过os.makedirs创建。然后用pix.writeImage按页码编号写入并保存图片。 准备 pip install fitz 代码 #!/usr/bin/env python # coding: utf-8# 因工作中的某些奇葩要求需要将PDF文件的每页内容转存成按顺序编号的图片。用第三方软件或者在线转换也可以但批量操作还是Python方便所谓搞定办公自动化Python出山一统天下Python出征寸草不生~ O(∩_∩)O# 不过这个需要用到PyMuPDF库电脑运行cmd输入“pip install PyMuPDF”安装即可。安装后通过import fitz导入模块。等等为什么安装的是PyMuPDF导入的是fitz俺PyMuPDF就是这么任性怎么的爱用不用哈哈开个玩笑。其实是因为PyMuPDF曾用名fitz-python所以只是fitz换了个马甲而已呵呵。# 这里先导入fitz库用于将PDF文件的页面提取成像素信息图片。再导入glob库用于获取后缀为.pdf的文件的文件名。os库可新建文件夹。# In[12]:#批量将PDF文件转为图片 import fitz import glob import osimage_path 图片\\ #存放图片的文件夹 PDFfiles glob.glob(PDF文件\\*.pdf) #获取所有pdf文件的文件名 for PDFfile in PDFfiles: #遍历所有PDF文件PDFdoc fitz.open(PDFfile) #读取PDF文件folder_name PDFfile.split(\\)[-1].split(.)[0] #按源文件名新建文件夹for pg in range(PDFdoc.pageCount): #根据PDF的页数,按页提取图片 page PDFdoc[pg]#增强图片分辨率zoom_x 3 #水平方向zoom_y 3 #垂直方向mat fitz.Matrix(zoom_x, zoom_y) pix page.getPixmap(matrixmat) #按原PDF名称新建文件夹并按顺序保存图片if not os.path.exists(image_pathfolder_name):#判断文件夹是否已存在os.makedirs(image_pathfolder_name)#不存在则新建存在就跳过这行pix.writeImage(image_pathfolder_name \\{}.png.format(str(pg1))) #按PDF中的页面顺序命名并保存图片# 以上我们先将所有待处理的PDF文件放入“PDF文件夹”然后通过glob.glob(PDF文件\\*.pdf)搜索并抓取所有以.pdf为后缀的文件并存入变量PDFfiles中。结果如下所示# In[2]:PDFfiles# 然后遍历PDFfiles中的所有PDF文件使用fitz.open()读取。fitz.open()用于创建PDF文件中页面的像素映射(pixel maps)即用像素来表示页面信息。然后按PDF文件名命名一个新的文件夹以便储存图片。比如给“收货记录.pdf”文件建一个名字为“收货记录”的文件夹专门储存关于它的页面的图片。随后用for循环根据PDF的页数按页提取图片。将每页的信息存入page变量它的type 是fitz.fitz.Page即一页像素文件。为了让图片看起来更清晰需要增强图片的分辨率设定图片水平及垂直方向的增强倍数传入Matrix。Matrix用于提升即将保存的图片的分辨率分辨率的提升倍数为zoom_x与zoom_y的乘积。倍数越大图片越清晰当然占用空间也越大。这个参数可根据实际要求调整。然后将Matrix存入mat传入getPixmap()。getPixmap()用于控制图片分辨率、色域比如生成灰度图像或带有减色方案的图像、透明度、旋转、镜像、移位、剪切等。由于其它都不需要专门设定所以只增强其分辨率。# 一页图片处理好后就需要保存图片了。先通过os.path.exists判断一下需要的文件夹是否存在若不存在就通过os.makedirs创建。然后用pix.writeImage按页码编号写入并保存图片。 # ![](result.png)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/913716.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用个人免费空间快速建立个人网站后方平台网站和新媒体建设方案

Java集合框架(Java Collections Framework)是一组用来表示和操作集合的类的集合,它提供了用于存储不同类型对象的标准化接口和类。Java集合框架的主要组成部分包括以下几个部分: 集合接口(Collection Interface&#…

做php网站教程wordpress首页摘要

1. 计算公式 https://baijiahao.baidu.com/s?id1750340479004609055&wfrspider&forpc Z087/SQRT(εr1.41)ln[(5.98h)/(0.8wt)] 常规来说阻抗与介电常数成反比,与介质层厚度成正比,与线宽成反比,与铜厚成反比。 Z0:印刷导线的特性阻抗 εr:绝缘…

软件工程:构建数字世界的基石

在当今数字化时代,软件无处不在,从智能手机上的应用程序到大型企业的复杂信息系统,软件已经成为我们生活中不可或缺的一部分。而软件工程,作为一门专注于软件开发的学科,其重要性也日益凸显。它不仅仅是编写代码,…

# Shell 文本处理三剑客:awk、sed 与常用小器具详解

# Shell 文本处理三剑客:awk、sed 与常用小器具详解2025-09-23 19:54 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; dis…

巴中模板建站价格多少网站备案 个人 单位

Flying-Saucer是一个不错的库,可以从Java应用程序中生成PDF文档。 只需生成一堆XHTML,然后将其放入渲染器中,然后使用iText生成所需的文档即可。 但是,当涉及条形码时,Flying-Saucer无法访问iText的内置条形码功能&am…

重庆网站建设changeke垂直网站怎么做

文章目录 【方法一】运用哈密顿凯莱定理相关例题 【方法二】运用特征方程二阶矩阵求解通法三阶矩阵求解通法相关例题 市面上许多资料给出的计算矩阵高次幂的方法,无外乎有这几种: 分块矩阵求解高次幂;先求低次方幂,然后通过找规律…

建设工程检测中心网站网站规划设计是什么

spContent《C语言程序设计》是高等学校本科教育普遍开设的一门课程,是广大程序设计语言学习者首选的入门课程。本课程立足于C语言基础知识的讲解,讲授中引入大量实例,突出重点,剖析难点,培养学生结构化程序设计的思想&…

网站建设 万网 域名做空包网站合法吗

函数概述 函数:组织好的、可重复使用的。杉树能提高应用的模块性和代码的重复利用性。Python提供了很多的内置函数,比如len()等等,可以自行定义函数。 函数的定义 def 函数名(参数列表): #函数定义 函数体…

网站建设的公司哪家是上市公司互动性的网站

List item 本篇将介绍Linux的时间管理&运行级别相关知识,并将深入介绍Linux的启动过程及原理。 Linux的时间管理 Linux 时钟分为系统时钟(System Clock)和硬件(Real Time Clock,简称 RTC)时钟。系统时…

老的网站为什么要改版新网站北京seowyhseo

最近对一系列基于3D Gaussian Splatting(3DGS)SLAM的工作的源码进行了测试与解读。为此写下本博客mark一下所有的源码解读以及对应的代码配置与测试记录~ 其中工作1~5的原理解读见博客: 学习笔记之——3D Gaussian Splatting及其在SLAM与自动…

大连龙彩科技的网站在谁家做公司网络安全管理制度和应急工作预案

笔记本屏幕的色域 72%NTSC和100%sRGB有什么区别2018-09-15 11:00:05247点赞724收藏60评论无论是选购普通笔记本还是游戏本,大家除了关心产品的外观和配置外,越来越多的朋友把重点放在了屏幕上,也许TN屏和IPS屏大家很好判断哪个更好&#xff0…

Avalonia 学习笔记07. Control Themes(控件主题)

在本章节中,我们的目标是创建一个可复用的、带图标的按钮控件,以简化我们在视图(View)中编写的XAML代码。当前,每创建一个带图标的按钮,都需要在 <Button> 内部嵌套一个 <StackPanel> 和两个 <La…

二手站网站怎做韩国外贸平台

在达梦数据库系统中&#xff0c;死锁是指两个或多个事务相互等待对方释放资源&#xff0c;从而造成循环等待的现象&#xff0c;严重影响数据库的正常运行。以下是使用达梦数据库进行死锁排查和解决的具体步骤&#xff1a; 死锁查看 查询当前死锁信息 SELECT lc.lmode, lc.ta…

网站建设比赛方案阿里巴巴网站架构

大家都知道&#xff0c;在Mac上进行文件拖拽是一件非常方便的事情。然而&#xff0c;随着我们在工作和生活中越来越多地使用电脑&#xff0c;我们对于这个简单操作的需求也越来越高。为了让您的文件拖拽体验更加高效和便捷&#xff0c;今天我们向大家介绍一款强大的工具——Dro…

南宁建设厅网站是什么学校网站建设实训总结

91. 请描述一下Intent 和 IntentFilter ?Intent是组件的通讯使者,可以在组件间传递消息和数据。 IntentFilter是intent的筛选器,可以对intent的action,data,catgory,uri这些属性进行筛选,确定符合的目标组件🚀🚀🚀🚀🚀🚀92. 阐述什么是IntentService?有何优…

php网站开发技术前景品牌建设的最高境界是培育客户的

图片来源&#xff1a;Thomas Hainmller, Marlene Bartos来源&#xff1a;生物谷摘要&#xff1a;最近&#xff0c;一项刊登在国际杂志Nature上的研究报告中&#xff0c;来自弗莱堡大学的科学家们通过研究开发出了一种新型模型来解释大脑如何储存一些“有形事件”&#xff08;ta…

网站tkd优化如何鉴别网站有没有做301重定向

任何简单或复杂的算法都可以由三种基本结构组成&#xff1a;顺序结构&#xff0c;选择结构&#xff0c;循环结构。 顺序结构 比较一般的结构&#xff0c;程序从上到下执行。 选择结构 我们从最简单的单路选择开始&#xff0c;符合条件的进入语句序列&#xff0c;不符合条件的…

dedecms网站根目录重庆专业网站设计服务

题目&#xff1a; 给定一个包含 n 个整数的数组 nums 和一个目标值 target&#xff0c;判断 nums 中是否存在四个元素 a&#xff0c;b&#xff0c;c 和 d &#xff0c;使得 a b c d 的值与 target 相等&#xff1f;找出所有满足条件且不重复的四元组。 注意&#xff1a; …

网站设计策划方案wordpress 移动导航呼出

一、网络加密的方式及实现 1、常见的加密算法 常见的密钥加密算法类型大体可以分为三类:对称加密、非对称加密、单向加密。 对称加密算法采用单密钥加密&#xff0c;在通信过程中&#xff0c;数据发送方将原始数据分割成固定大小的块&#xff0c;经过密钥和加密算法逐个加密…

网站个人备案 企业备案提供手机网站制作哪家好

nvm安装后nvm -v有效&#xff0c;node指令无效 环境变量配置无问题 推荐方案 下载你需要的node版本 Index of /dist/ (nodejs.org) 下载后解压到你的nvm存储版本的位置 cmd进入切换你的使用版本&#xff08;此时你的nodejs是从网上下载的&#xff0c;npm文件是存在的&…