Apache POI详解

目录

 

 前言

        Apache POI是一个强大的Java库,广泛用于处理Microsoft Office文档,包括Word、Excel和PowerPoint等。本文将详细介绍如何使用Apache POI库操作Word模板(包括替换占位符、操作表格)、将Word文档转换为PDF,以及如何处理PowerPoint文档。我们将通过代码示例逐步演示这些操作。

1. Apache POI简介

依赖配置

2. 操作Word模板中的占位符

示例:替换占位符

3. 操作Word模板中的表格

示例:操作表格

4. 将Word文档转换为PDF

示例:使用Apache PDFBox将Word转换为PDF

5. 处理PowerPoint文档

示例:操作PowerPoint文档

6. 总结


 前言

        Apache POI是一个强大的Java库,广泛用于处理Microsoft Office文档,包括Word、Excel和PowerPoint等。本文将详细介绍如何使用Apache POI库操作Word模板(包括替换占位符、操作表格)、将Word文档转换为PDF,以及如何处理PowerPoint文档。我们将通过代码示例逐步演示这些操作。

1. Apache POI简介

Apache POI(Poor Obfuscation Implementation)是一个开源的Java库,主要用于处理Microsoft Office文档。它支持多种Office文档格式,包括:

  • Word.doc(旧版)和.docx(新版)。
  • Excel.xls(旧版)和.xlsx(新版)。
  • PowerPoint.ppt(旧版)和.pptx(新版)。

依赖配置

在使用Apache POI之前,需要在项目中添加相关的依赖。以下是Maven项目中常用的依赖配置:

<dependency><groupId>org.apache.poi</groupId><artifactId>poi</artifactId><version>3.17</version>
</dependency>
<dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>3.17</version>
</dependency>
<dependency><groupId>org.apache.poi</groupId><artifactId>poi-scratchpad</artifactId><version>3.17</version>
</dependency>
  • poi:包含POI的核心功能,支持旧版Office格式。
  • poi-ooxml:支持新版Office格式(如.docx.xlsx.pptx)。
  • poi-scratchpad:提供了一些额外的功能,如处理Outlook邮件格式。

2. 操作Word模板中的占位符

在Word模板中,我们通常使用${}作为占位符,表示需要动态替换的内容。以下代码示例展示了如何读取Word模板并替换占位符。

示例:替换占位符

假设我们有一个Word模板template.docx,内容如下:

尊敬的${name}:您的订单编号为${orderId},已成功支付。

简单代码示例:

import org.apache.poi.xwpf.usermodel.*;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
public class WordTemplateExample {public static void main(String[] args) throws IOException {// 打开Word模板FileInputStream file = new FileInputStream("template.docx");XWPFDocument document = new XWPFDocument(file);// 定义占位符的替换内容Map<String, String> replacements = new HashMap<>();replacements.put("${name}", "张三");replacements.put("${orderId}", "123456");// 遍历段落并替换占位符for (XWPFParagraph paragraph : document.getParagraphs()) {String text = paragraph.getText();for (Map.Entry<String, String> entry : replacements.entrySet()) {if (text != null && text.contains(entry.getKey())) {text = text.replace(entry.getKey(), entry.getValue());paragraph.removeRun(0); // 删除原有内容paragraph.createRun().setText(text); // 插入新内容}}}// 保存修改后的文档FileOutputStream out = new FileOutputStream("output.docx");document.write(out);// 关闭文档document.close();out.close();}
}

3. 操作Word模板中的表格

Word文档中的表格是常见的结构化数据展示方式。以下代码示例展示了如何读取和修改Word模板中的表格。

示例:操作表格

假设我们有一个Word模板template.docx,其中包含一个表格:

| 姓名   | 年龄 | 性别 |
|--------|------|------|
| ${name}| ${age}| ${gender}|

 简单代码示例:

import org.apache.poi.xwpf.usermodel.*;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
public class WordTableExample {public static void main(String[] args) throws IOException {// 打开Word模板FileInputStream file = new FileInputStream("template.docx");XWPFDocument document = new XWPFDocument(file);// 定义占位符的替换内容Map<String, String> replacements = new HashMap<>();replacements.put("${name}", "李四");replacements.put("${age}", "25");replacements.put("${gender}", "男");// 遍历表格并替换占位符for (XWPFTable table : document.getTables()) {for (XWPFTableRow row : table.getRows()) {for (XWPFTableCell cell : row.getTableCells()) {for (XWPFParagraph paragraph : cell.getParagraphs()) {String text = paragraph.getText();for (Map.Entry<String, String> entry : replacements.entrySet()) {if (text != null && text.contains(entry.getKey())) {text = text.replace(entry.getKey(), entry.getValue());paragraph.removeRun(0); // 删除原有内容paragraph.createRun().setText(text); // 插入新内容}}}}}}// 保存修改后的文档FileOutputStream out = new FileOutputStream("output.docx");document.write(out);// 关闭文档document.close();out.close();}
}

4. 将Word文档转换为PDF

将Word文档转换为PDF是一个常见的需求。我们可以使用Apache POI结合其他库(如Apache PDFBoxiText)来实现这一功能。

示例:使用Apache PDFBox将Word转换为PDF

首先,添加PDFBox的依赖:

<dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version>2.0.27</version>
</dependency>

简单代码示例:

import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
import org.apache.pdfbox.pdmodel.PDPageContentStream;
import org.apache.pdfbox.pdmodel.font.PDType1Font;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
public class WordToPdfExample {public static void main(String[] args) throws IOException {// 打开Word文档FileInputStream file = new FileInputStream("output.docx");XWPFDocument document = new XWPFDocument(file);// 创建PDF文档PDDocument pdfDocument = new PDDocument();PDPage page = new PDPage();pdfDocument.addPage(page);// 写入PDF内容PDPageContentStream contentStream = new PDPageContentStream(pdfDocument, page);contentStream.setFont(PDType1Font.HELVETICA_BOLD, 12);contentStream.beginText();contentStream.newLineAtOffset(100, 700);for (XWPFParagraph paragraph : document.getParagraphs()) {contentStream.showText(paragraph.getText());contentStream.newLineAtOffset(0, -15);}contentStream.endText();contentStream.close();// 保存PDF文件pdfDocument.save("output.pdf");// 关闭文档pdfDocument.close();document.close();}
}

5. 处理PowerPoint文档

Apache POI也支持处理PowerPoint文档。以下代码示例展示了如何读取和修改PowerPoint文档。

示例:操作PowerPoint文档

假设我们有一个PowerPoint模板template.pptx,其中包含一个幻灯片,内容为:

标题:${title}
内容:${content}

操作PowerPoint文档的简单代码示例:

import org.apache.poi.xslf.usermodel.*;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
public class PowerPointExample {public static void main(String[] args) throws IOException {// 打开PowerPoint模板FileInputStream file = new FileInputStream("template.pptx");XMLSlideShow ppt = new XMLSlideShow(file);// 定义占位符的替换内容Map<String, String> replacements = new HashMap<>();replacements.put("${title}", "项目报告");replacements.put("${content}", "这是项目的最新进展。");// 遍历幻灯片并替换占位符for (XSLFSlide slide : ppt.getSlides()) {for (XSLFShape shape : slide.getShapes()) {if (shape instanceof XSLFTextShape) {XSLFTextShape textShape = (XSLFTextShape) shape;String text = textShape.getText();for (Map.Entry<String, String> entry : replacements.entrySet()) {if (text != null && text.contains(entry.getKey())) {text = text.replace(entry.getKey(), entry.getValue());textShape.clearText(); // 清除原有内容textShape.setText(text); // 插入新内容}}}}}// 保存修改后的文档FileOutputStream out = new FileOutputStream("output.pptx");ppt.write(out);// 关闭文档ppt.close();out.close();}
}

6. 总结

通过Apache POI库,可以轻松地操作Word模板(包括替换占位符、操作表格)、将Word文档转换为PDF,以及处理PowerPoint文档。本文提供了详细的代码示例,帮助您快速上手这些操作。如果您有更多需求或问题,欢迎在评论区留言讨论!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/73311.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AutoGen多角色、多用户、多智能体对话系统

2023-03-11-AutoGen 使用【autoGenchainlitdeepSeek】实现【多角色、多用户、多智能体对话系统】 1-核心思路 01&#xff09;技术要点&#xff1a;autoGenchainlitdeepSeek02&#xff09;什么是autoGen->autogen是微软旗下的多智能体的框架03&#xff09;什么是chainlit-&g…

问deepseek: OpenFOAM并行分区后,是如何实现ldumatrix矩阵向量乘法计算逻辑的?

在OpenFOAM中&#xff0c;lduMatrix 是用于存储稀疏矩阵的类&#xff0c;支持并行计算。并行分区后&#xff0c;lduMatrix 的矩阵向量乘法通过以下步骤实现&#xff1a; 1. 矩阵分区 分区&#xff1a;将矩阵和向量分配到多个处理器上&#xff0c;每个处理器负责一部分。接口&…

数据类设计_图片类设计之4_规则类图形混合算法(前端架构)

前言 学的东西多了,要想办法用出来.C和C是偏向底层的语言,直接与数据打交道.尝试做一些和数据方面相关的内容 引入 接续上一篇,讨论图片类型设计出来后在场景中如何表达,以及图片的混合算法.前面的内容属于铺垫和基础,这篇内容和实际联系起来了. 背景图和前景图 这里笔者想先…

【openwebui 搭建本地知识库(RAG搭建本地知识库)】

安装准备 openwebui 这个本地安装之前写过使用python安装。也可以直接用docker 命令 docker run --rm -d \-p 3080:8080 \-p 3081:8081 \-e WEBUI_AUTHtrue \-e DEFAULT_LOCALEcn \-e GLOBAL_LOG_LEVEL"INFO" \-e AIOHTTP_CLIENT_TIMEOUT100 \--privilegedtrue \-…

Nginx的流式响应配置详解

现在大模型场景繁多&#xff0c;项目中涉及nginx转发大模型的流式数据时&#xff0c;需配置nginx的转发策略&#xff1a; location /streaming {proxy_pass http://backend_server;proxy_cache off; # 关闭缓存proxy_buffering off; # 关闭代理缓冲chunked_transfer_encoding …

git使用命令总结

文章目录 Git 复制创建提交步骤Git 全局设置:创建 git 仓库:已有仓库? 遇到问题解决办法&#xff1a;问题一先git pull一下&#xff0c;具体流程为以下几步&#xff1a; 详细步骤 Git 复制 git clone -b RobotModelSetting/develop https://gitlab.123/PROJECT/123.git创建提…

flutter 图片资源路径管理

1. 创建统一资源管理类 创建一个单独的 Dart 文件&#xff08;比如 manager.dart&#xff09;&#xff0c;将所有图片路径集中管理。这样在引用图片时&#xff0c;不需要每次都手动输入完整路径&#xff0c;只需通过常量引用即可。 //manager.dartclass Manager { static co…

Android Retrofit 框架配置与构建模块深入源码分析(六)

一、引言 Retrofit 是一个在 Android 和 Java 开发中广泛使用的类型安全的 HTTP 客户端。它通过简洁的 API 设计&#xff0c;使得网络请求的处理变得高效且易于管理。配置与构建模块作为 Retrofit 的基础部分&#xff0c;承担着初始化和定制 Retrofit 实例的重要任务。开发者可…

80.Dictionary 字典 C#例子

使用 C# 中的 Dictionary 数据结构 在 C# 中&#xff0c;Dictionary<TKey, TValue> 是一个非常强大的数据结构&#xff0c;用于存储键值对。它提供了高效的查找、插入和删除操作&#xff0c;适用于需要快速访问数据的场景。本文将通过一个简单的示例&#xff0c;介绍如何…

tomcat负载均衡配置

这里拿Nginx和之前做的Tomcat 多实例来实现tomcat负载均衡 1.准备多实例与nginx tomcat单机多实例部署-CSDN博客 2.配置nginx做负载均衡 upstream tomcat{ server 192.168.60.11:8081; server 192.168.60.11:8082; server 192.168.60.11:8083; } ser…

C语言中scanf(“%c“,s)会出现的问题

scanf("%c%c", &word[0], &word[1]);的行为与输入缓冲区的内容密切相关。你提到输入ab后&#xff0c;word[0]是\n&#xff0c;这通常是因为输入缓冲区中残留了换行符&#xff08;\n&#xff09;。 一、原因分析 换行符残留 若在输入ab之前有其他输入操作&a…

SealOS部署k8s集群(单节点)

一、 先决条件 每个集群节点应该有不同的主机名。需要在 K8s 集群的第一个 master 节点上运行 sealos run 命令。建议使用干净的操作系统来创建集群。不要自己装 Docker&#xff01;支持大多数 Linux发行版&#xff0c;但内核版本建议5以上。例如&#xff1a;Ubuntu、CentOS、…

Linux 服务器安全配置:密码复杂度与登录超时设置

Linux服务器安全配置指南:密码复杂度与登录超时设置 一、密码复杂度设置 通过PAM模块pam_cracklib.so实现密码强度策略,配置文件: system-auth该文件主要用于定义系统范围内的认证策略,涵盖了用户登录、su 命令切换用户、sudo 权限提升等多种认证场景。当用户尝试进行系…

AI Agent开发框架分析:前端视角

1. Mastra (https://mastra.ai/docs) 优点&#xff1a; 提供直观的界面构建器&#xff0c;适合无代码/低代码开发支持JavaScript/TypeScript&#xff0c;可直接集成到前端项目可视化工作流设计&#xff0c;降低入门门槛内置多种UI组件&#xff0c;加速前端开发 缺点&#xf…

linux上使用unsloth微调大模型的环境踩坑之路-4070ti、4090

我们实验室有2套环境 一套&#xff1a;4070ti。安装了cuda12.4 一套&#xff1a;3张4090.安装了cuda12.4 现在开始给第一套装能运行unsloth能运行的环境 第一步&#xff1a;开始创建虚拟环境 conda create -n test_env python3.11 第二步&#xff1a;进入虚拟环境 conda activa…

网络安全演练有哪些形式

OPENVAS使用 1、确定指定IP是否能ping通 2、创建扫描目标 3、创建扫描任务&#xff08;scan management →newtask&#xff09; 4、开始任务start 5、查看扫描细节 6、查看扫描结果&#xff0c;包含漏洞详细信息&#xff0c;亦可到处PDF文件 7、导出扫描结果报告 8、为…

ConcurrentModificationException:检测到并发修改完美解决方法

&#x1f6a6; ConcurrentModificationException&#xff1a;检测到并发修改完美解决方法 &#x1f4a1; 摘要 1. 什么是ConcurrentModificationException&#xff1f;&#x1f914; 2. ConcurrentModificationException的常见场景 &#x1f6a6; 2.1 使用for-each循环遍历集合…

电路原理(电容 集成电路NE555)

电容 1.特性&#xff1a;充放电&#xff0c;隔直流&#xff0c;通交流 2.电容是通过聚集正负电荷来存储电能的 3.电容充放电过程可等效为导通回路 4.多电容并联可以把容量叠加&#xff0c;但是多电容串联就不会&#xff0c;只会叠加电容的耐压值。 6.电容充放电时相当于通路&a…

深入解析 React 最新特性:革新、应用与最佳实践

深入解析 React 最新特性&#xff1a;革新、应用与最佳实践 1. 引言 React 作为前端开发的核心技术之一&#xff0c;近年来不断推出 新的 API 和优化机制&#xff0c;从 Concurrent Rendering&#xff08;并发模式&#xff09; 到 Server Components&#xff08;服务器组件&a…

【氮化镓】高输入功率应力诱导的GaN 在下的退化LNA退化

2019年,中国工程物理研究院电子工程研究所的Tong等人基于实验与第一性原理计算方法,研究了Ka波段GaN低噪声放大器(LNA)在高输入功率应力下的退化机制。实验结果表明,在27 GHz下施加1 W连续波(CW)输入功率应力后,LNA的增益下降约1 dB,噪声系数(NF)增加约0.7 dB。进一…