【工具类】PDF文件转图片

PDF文件转文件

1. 引入Maven依赖

主要使用了 pdfbox 包与 hutool 包。
pdfbox 负责 pdf 到图片的转换;
hutool 负责文件读取转换。

<dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version>2.0.27</version>
</dependency>
<dependency><groupId>cn.hutool</groupId><artifactId>hutool-all</artifactId><version>5.8.34</version>
</dependency>
2. 代码实现

主要思路:
pdfbox 提供了操作输入流与操作字节数组的两种方式。

2.1 字节数组
public void pdf2Image() {// 这边简单采用读取本地文件的形式File file = new File("");File outFile = new File("");byte[] bytes = FileUtil.readBytes(file);String formatName = "png";try (PDDocument document = PDDocument.load(bytes)) {PDFRenderer pdfRenderer = new PDFRenderer(document);int numberOfPages = document.getNumberOfPages();// 将 BufferedImage 转换为字节数组ByteArrayOutputStream baos = new ByteArrayOutputStream();for (int i = 0; i < numberOfPages; i++) {// 渲染第一页为 BufferedImageBufferedImage bufferedImage = pdfRenderer.renderImageWithDPI(0, 50);ImgUtil.write(bufferedImage, formatName, baos);}OutputStream outputStream = new FileOutputStream(outFile);baos.writeTo(outputStream);} catch (Exception e) {e.printStackTrace();}
}

通过字节数组可实现 pdf 文件转换为图片,但是这个代码在处理大文件时会一次性把文件读进内存导致内存溢出

2.2 文件流
public void pdf2Image() {File file = new File("");File outFile = new File("");String formatName = "png";try (InputStream is = new BufferedInputStream(new FileInputStream(file))) {PDDocument document = PDDocument.load(is, MemoryUsageSetting.setupTempFileOnly());PDFRenderer pdfRenderer = new PDFRenderer(document);int numberOfPages = document.getNumberOfPages();// 将 BufferedImage 转换为字节数组ByteArrayOutputStream baos = new ByteArrayOutputStream();for (int i = 0; i < numberOfPages; i++) {// 渲染第一页为 BufferedImageBufferedImage bufferedImage = pdfRenderer.renderImageWithDPI(0, 50);ImgUtil.write(bufferedImage, formatName, baos);}OutputStream outputStream = new FileOutputStream(outFile);baos.writeTo(outputStream);} catch (Exception e) {e.printStackTrace();}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/73650.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用DeepSeek,优化斐波那契数函数,效果相当不错

下面这段代码定义了一个递归函数 fibonacci&#xff0c;用于计算第 n 个斐波那契数。 def fibonacci(n):if n < 1:return nelse:return fibonacci(n - 1) fibonacci(n - 2)虽然代码逻辑正确&#xff0c;但其性能较差&#xff0c;尤其是对于较大的 n 值&#xff0c;其复杂度…

Forward Looking Radar Imaging by Truncated Singular Value Decomposition 论文阅读

Forward Looking Radar Imaging by Truncated Singular Value Decomposition and Its Application for Adverse Weather Aircraft Landing 1. 论文的研究目标与意义1.1 研究目标1.2 实际问题与意义2. 论文的创新方法与公式解析2.1 信号建模与问题转化2.2 截断奇异值分解(TSVD)…

provide/inject源码实现

在 Vue 3 中&#xff0c;provide 和 inject 是通过 Vue 的响应式系统和组件实例机制实现的&#xff0c;底层是依赖 Vue 3 中的 Proxy 和 Reactive 来实现跨层级的数据传递和响应式绑定。以下是一个简化版的实现逻辑&#xff0c;帮助理解 Vue 3 中 provide 和 inject 是如何实现…

Unix时间戳BKP备份寄存器RTC实时时钟

Unix时间戳 Unix时间戳&#xff0c;也称为POSIX时间或Epoch时间&#xff0c;是一种在Unix和类Unix操作系统中使用的时间表示方法。它表示的是自1970年1月1日00:00:00 UTC&#xff08;协调世界时&#xff09;至当前时间经过的秒数&#xff0c;不考虑闰秒。Unix时间戳通常以秒为…

【Linux内核系列】:进程板块与文件板块的综合

&#x1f525; 本文专栏&#xff1a;Linux &#x1f338;作者主页&#xff1a;努力努力再努力wz &#x1f4aa; 今日博客励志语录&#xff1a; 人生中成功只是一时的&#xff0c;失败却是人生的主旋律&#xff0c;但是如何面对失败却把人分成了不同的样子&#xff0c;有的人会被…

CellOracle|基因扰动研究基因功能|基因调控网络+虚拟干预

在gzh“生信小鹏”同步文章 论文来源: 发表期刊:Nature发表时间:2023年2月23日论文题目:Dissecting cell identity via network inference and in silico gene perturbation研究团队:Kenji Kamimoto 等,华盛顿大学医学院1. 研究背景与问题提出 细胞身份(Cell Identit…

专线、云 和 物联网(IoT)

专线、云 和 物联网&#xff08;IoT&#xff09; 是现代信息与通信技术&#xff08;ICT&#xff09;领域的三大重要组成部分&#xff0c;它们在企业和个人的数字化转型中扮演着关键角色。以下是对这三者的详细介绍及其相互关系&#xff1a; 1. 专线&#xff08;Leased Line&…

[Lc14_priority_queue] 最后一块石头重量 | 数据流中的第 K 大元素 | 前K个高频单词 | 数据流的中位数

目录 1.最后一块石头的重量 题解 2.数据流中的第 K 大元素 题解 3.前K个高频单词 题解 代码 ⭕4.数据流的中位数 题解 在C中&#xff0c;使用标准库中的priority_queue&#xff0c;默认情况下它是一个最大堆&#xff08;即大堆排序&#xff09;&#xff0c;这意味着最…

XSS漏洞靶场---(复现)

XSS漏洞靶场—&#xff08;复现&#xff09; 反射型 XSS 的特点是攻击者诱导用户点击包含恶意脚本的 URL&#xff0c;服务器接收到请求后将恶意脚本反射回响应页面&#xff0c;浏览器执行该脚本从而造成攻击&#xff0c;恶意脚本不会在服务器端存储。 Level 1(反射型XSS) 此漏…

2025/3.17 郭院安排会议与南京银行参访

目录 *郭院会议&#xff1a;服务外包*1.会遇到的问题以及解决方案2.考虑行业目前会碰到的瓶颈3.后端应该呈现处理图像的过程4.记得做报告、文档说明和视频等工作 *南京银行&#xff08;鑫合易家&#xff09;参访记录*1. 风险评分业务流程笔记![在这里插入图片描述](https://i-b…

Cloud Ace 宣布成为 Langfuse 亚太地区首个代理商,提供 LLM 全链路解决方案

Cloud Ace 宣布正式代理 Langfuse 产品&#xff0c;是 Langfuse 在亚太地区唯一的官方授权经销商&#xff0c;全面负责其商用许可证的销售、部署与技术支持服务。通过此次合作&#xff0c;Cloud Ace 将充分发挥 Langfuse 的先进技术能力与行业专业知识&#xff0c;为企业级客户…

Helm 的仓库管理与 Chart 搜索

在使用 Helm 管理 Kubernetes 应用的过程中&#xff0c;仓库管理与 Chart 搜索是两个核心功能。通过 Helm 仓库&#xff0c;用户可以方便地存储、分享和获取 Helm Chart&#xff0c;而搜索功能则帮助用户快速找到所需的 Chart。本文将详细介绍 Helm 仓库的概念、管理方法以及如…

Matlab 汽车振动多自由度非线性悬挂系统和参数研究

1、内容简介 略 Matlab 169-汽车振动多自由度非线性悬挂系统和参数研究 可以交流、咨询、答疑 2、内容说明 略 第二章 汽车模型建立 2.1 汽车悬架系统概述 2.1.1 悬架系统的结构和功能 2.1.2 悬架分类 2.2 四分之一车辆模型 对于车辆动力学&#xff0c;一般都是研究其悬…

免训练指标(Zero-Cost Proxies)

1. 什么是免训练指标&#xff08;Zero-Cost Proxies&#xff0c;ZC proxies&#xff09;&#xff1f; 免训练指标是一类 无需完整训练模型即可评估其性能的度量方法&#xff0c;主要用于提高 神经架构搜索&#xff08;NAS&#xff09; 的效率。 传统 NAS 需要训练候选架构来评…

C语言 —— 此去经年梦浪荡魂音 - 深入理解指针(卷二)

目录 1. 数组名与地址 2. 指针访问数组 3.一维数组传参本质 4.二级指针 5. 指针数组 6. 指针数组模拟二维数组 1. 数组名与地址 我们先看下面这个代码&#xff1a; int arr[10] { 1,2,3,4,5,6,7,8,9,10 };int* p &arr[0]; 这里我们使用 &arr[0] 的方式拿到了数…

基于Python pyscard库采集ACS ACR122U NFC读卡器数据的详细操作步骤

步骤1&#xff1a;安装驱动 1. 下载驱动&#xff1a; - 访问ACS官网的驱动下载页面&#xff1a;[ACR122U驱动下载](https://www.acs.com.hk/en/drivers/6/acr122u-nfc-reader/)。 - 选择适用于Windows的驱动&#xff08;如 ACR122U Driver (Windows) V3.05.02.zip&#xff09;…

深度学习 Deep Learning 第1章 深度学习简介

第1章 深度学习简介 概述 本章介绍人工智能&#xff08;AI&#xff09;和深度学习领域&#xff0c;讨论其历史发展、关键概念和应用。解释深度学习如何从早期的AI和机器学习方法演变而来&#xff0c;以及如何有效解决之前方法无法应对的挑战。 关键概念 1. 人工智能的演变 …

python实现简单的图片去水印工具

python实现简单的图片去水印工具 使用说明&#xff1a; 点击"打开图片"选择需要处理的图片 在图片上拖拽鼠标选择水印区域&#xff08;红色矩形框&#xff09; 点击"去除水印"执行处理 点击"保存结果"保存处理后的图片 运行效果 先简要说明…

软件功能性测试有哪些步骤和挑战?软件测评服务机构分享

软件功能性测试是对软件系统进行验证的一种基本方法。其主要目标是确保软件系统能够按照预期的要求和功能进行操作。从用户的角度看&#xff0c;功能性测试旨在检查软件是否实现了所有要求的功能&#xff0c;保证用户体验的顺畅与满意。 一、软件功能性测试的测试步骤   1、…

《C#上位机开发从门外到门内》3-4:基于TCP/IP的远程监控系统设计与实现

文章目录 一、项目概述二、系统架构设计三、通信协议设计四、功能模块实现五、系统安全性与稳定性六、性能优化与测试七、实际应用案例八、结论 随着信息技术的飞速发展&#xff0c;远程监控系统在工业自动化、智能家居、环境监测等领域的应用日益广泛。基于TCP/IP协议的远程监…