wrod生成pdf。[特殊字符]改背景

import subprocess
import os,time
from rembg import remove, new_session
from PIL import Image
import io
from docxtpl import DocxTemplate, InlineImage
from docx.shared import Inches

input_folder = ‘tupian’ # 输入文件夹
kouchu_folder = ‘kouchu’ # 去背景图像保存文件夹
output_folder = ‘dangan’ # 合成后的输出文件夹
background_folder = ‘beijing’ # 背景文件夹
model_path = “mode/u2net.onnx” # 模型路径
wendang_path = “wendang” # 模型路径
pdf_path = “pdf” # 模型路径
doc = DocxTemplate(“moban.docx”)
context = {
‘company_name’: “World company”,
}

如果输出文件夹不存在,则创建它

if not os.path.exists(output_folder):
os.makedirs(output_folder)

获取背景文件夹中的所有背景图片

background_images = [f for f in os.listdir(background_folder) if f.lower().endswith((‘.png’, ‘.jpg’, ‘.jpeg’))]

Function to convert docx to PDF

def convert_to_pdf(docx_path, pdf_output_path):
subprocess.run([“/Applications/LibreOffice.app/Contents/MacOS/soffice”, “–headless”, “–convert-to”, “pdf”, docx_path, “–outdir”, pdf_output_path])

遍历输入文件夹中的所有图片文件

for filename in os.listdir(input_folder):
input_path = os.path.join(input_folder, filename)

# 确保文件是图片文件(你可以根据需要调整此条件)
if filename.lower().endswith(('.png', '.jpg', '.jpeg')):output_path = os.path.join(kouchu_folder, filename)# 读取输入图片并去背景with open(input_path, 'rb') as input_file:input_data = input_file.read()session = new_session(model_name='u2net_custom', model_path=model_path)output_data = remove(input_data, session=session)# 将去除背景后的数据转为图片input_image = Image.open(io.BytesIO(output_data))with open(output_path, 'wb') as output_file:output_file.write(output_data)# 遍历背景文件夹中的所有背景图像for bg_filename in background_images:background_path = os.path.join(background_folder, bg_filename)background_image = Image.open(background_path)# 调整背景大小,使其与输入图像大小匹配background_image = background_image.resize(input_image.size)# 合成图像:将去背景后的图片合成到背景上background_image = background_image.convert("RGBA")input_image = input_image.convert("RGBA")# 合成图像(将前景图像叠加到背景上)combined_image = Image.alpha_composite(background_image, input_image)# 将合成后的图像转换为RGB模式并保存combined_image = combined_image.convert("RGB")# 创建输出路径,根据背景文件名生成不同的输出文件名output_filename = f"{os.path.splitext(filename)[0]}_{os.path.splitext(bg_filename)[0]}.jpg"output_path = os.path.join(output_folder, output_filename)# 保存合成后的图片combined_image.save(output_path)print(f"处理并保存了 {filename} 与 {bg_filename} 合成的图片 到 {output_path}")context['company_logo'] = InlineImage(doc, output_path, width=Inches(2))  # 插入图片并设置宽度print(context)# 渲染模板doc.render(context)# 保存生成的文档doc_output_path = os.path.join(wendang_path, f"generated_doc_{os.path.splitext(filename)[0]}_{os.path.splitext(bg_filename)[0]}.docx")doc.save(doc_output_path)# 延迟2秒time.sleep(2)pdf_output_path = os.path.join(pdf_path,f"generated_doc_{os.path.splitext(filename)[0]}_{os.path.splitext(bg_filename)[0]}.pdf")convert_to_pdf(doc_output_path, pdf_output_path)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/80026.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于SpringBoot和PostGIS的应急运输事件影响分析-以1.31侧翻事故为例

目录 前言 一、技术实现路径 1、需要使用的数据 2、空间分析方法 二、相关模块设计与实现 1、运输路线重现开发 2、事故点影响范围实现 3、WebGIS可视化实现 三、讨论 1、界面结果展示 2、影响范围分析 四、总结 前言 在交通运输发达的当今社会,应急运输…

NetBox:运维利器,网络与数据中心管理平台

NetBox 详细介绍:开源 IPAM 和 DCIM 工具的全面解析 1. 引言 在现代网络和数据中心管理中,基础设施的复杂性不断增加,传统的电子表格或手动记录方式已无法满足高效、准确和可扩展的管理需求。NetBox 作为一个开源的 IP 地址管理&#xff08…

澳鹏干货 | 动态判断:如何用“群体智慧“优化AI数据标注流程?

20世纪初,800人集体猜测一头公牛的重量,结果与真实数值误差不足1%——这就是著名的"群体智慧"效应。如今,这一古老智慧正以全新形态赋能AI训练:通过动态优化标注流程,让AI训练结果像人群一样达成精准共识。 …

go.mod没有自动缓存问题

今天在安装Gin框架的时候遇到了一个问题 在Terminal运行下面命令安装时,包已经被下载安装到了GoPath中的bkg/mod go get -u github.com/gin-gonic/gin但是由于使用的是Go Modules,GPT以及大多数人给的说法是 运行完这个依赖包会被自动同步更新到go.mod…

数据结构——排序(万字解说)初阶数据结构完

目录 1.排序 2.实现常见的排序算法 2.1 直接插入排序 ​编辑 2.2 希尔排序 2.3 直接选择排序 2.4 堆排序 2.5 冒泡排序 2.6 快速排序 2.6.1 递归版本 2.6.1.1 hoare版本 2.6.1.2 挖坑法 2.6.1.3 lomuto前后指针 2.6.1.4 时间复杂度 2.6.2 非递归版本 2.7 归并排序…

AWS上构建基于自然语言和LINDO API的线性规划与非线性规划的优化计算系统

我想要实现一个通过使用C#、Semantic Kernel库、OpenAI GPT 4的API和附件文档里提到的LINDO API 15.0实现通过中文自然语言提示词中包含LATEX代码输入到系统,通过LINDO API 15.0线性规划与非线性规划的优化计算程序输出计算结果和必要步骤的应用,结果用中文描述出来,这样的L…

海外短剧H5系统开发:技术架构、SEO优化与全球市场突围策略 [2025版]

随着全球数字娱乐消费的升级,海外短剧市场正以年均300%的增速爆发式增长。数据显示,2025年海外短剧市场规模预计突破450亿美元,用户付费意愿(ARPPU达25-50美元)远超国内67。H5系统凭借其轻量化、跨平台兼容性和低成本开…

7D-AI系列:模型微调之mlx-lm

大模型的出现,导致信息量太大,只有静心动手操作,才能得到真理。 文章目录 环境要求安装示例mlx-lm微调工具参数准备数据集下载模型微调模型合并模型验证结果验证微调前的模型验证微调后的模型 环境要求 macbook pro m系列芯片mlx环境已安装 …

Docker —— 隔离的基本操作(1)

Docker —— 隔离的基本操作(1) 1. 用户和权限隔离2. 进程隔离3. 文件系统隔离4. 资源隔离(Cgroups)5. 网络隔离6. 安全增强(SELinux/AppArmor)7. 容器技术(Docker/LXC)总结 dd基本语…

PWN基础-ROP技术-ret2syscall突破NX保护

ROP(Return-Oriented Programming,返回导向编程)是一种利用程序已有代码片段来执行任意指令的攻击技术,常用于绕过现代系统的安全机制,尤其是不可执行栈(NX)。 常规检查一下: 32 位…

关于 js:2. 对象与原型链

一、对象 对象是: 键值对集合 所有非原始类型(number、string、boolean、null、undefined、symbol、bigint)都是对象 支持动态增删属性 每个对象都继承自 Object.prototype,具备原型链结构 1. 对象的创建方式 字面量方式&a…

AtCoder 第404场初级竞赛 A~E题解

A Not Found 【题目链接】 原题链接:A - Not Found 【考点】 枚举,数组计数法 【题目大意】 找到在26个字母中,未输出的一个字母,如果有多个,输出其中一个即可。 【解析】 遍历字符串,使用数组的记录对应字母的出现次数,最后遍历数组为0的下标,输出对应的字母即…

检测内存条好坏有工具,推荐几款内存检测工具

检测内存条的好坏其实很重要,这直接就关系到计算机是不是能够稳定的运行,也有一部分人就会关注内存检测的工具。你应该如何来选择的,不如看一下以下的这几个。 MemTest86是一个比较受到大家喜欢的内存检测工具,会支持各种类型&…

01Introduction

文本主题 关于协作式多智能体强化学习的简介 文章目录 文本主题一、MARL主要框架集中式训练与执行 (CTE)集中式训练分布式执行(CTDE)分布式训练与执行(DTE) 二、Dec-POMDPjoint policy V and Q 一、MARL主要框架 MARL当前主流的…

小程序问题(记录版)

1、样式不生效 在h5上生效 但是 小程序上没反应 解决办法:解除组件样式隔离 1、isolated 表示启用样式隔离,在自定义组件内外,使用 class 指定的样式将不会相互影响(一般情况下的默认值) 2、apply-shared 表示页面 wxs…

排列组合算法:解锁数据世界的魔法钥匙

在 C 算法的奇幻世界里,排列和组合算法就像是两把神奇的魔法钥匙,能够帮我们解锁数据世界中各种复杂问题的大门。今天,作为 C 算法小白的我,就带大家一起走进排列和组合算法的奇妙天地。 排列算法:创造所有可能的顺序…

深入探讨 UDP 协议与多线程 HTTP 服务器

深入探讨 UDP 协议与多线程 HTTP 服务器 一、UDP 协议:高效但“不羁”的传输使者 UDP 协议以其独特的特性在网络传输中占据一席之地,适用于对实时性要求高、能容忍少量数据丢失的场景。 1. UDP 的特点解析 无连接:无需提前建立连接&…

引用第三方自定义组件——微信小程序学习笔记

1. 使用 npm 安装第三方包 1.1 下载安装Node.js 工具 下载地址:Node.js — Download Node.js 1.2 安装 npm 包 在项目空白处右键弹出菜单,选择“在外部终端窗口打开”,打开命令行工具,输入以下指令: 1> 初始化:…

数字化转型是往哪转?怎么转?

写在前面 当下数字化转型的风还在吹,企业数字化转型过程中以数字化项目满足业务化需求,已有相关数字化平台的话,就搞大平台、大系统,解决数据孤岛。政府数字化转型亦是如此,某些省市发了系统优化整合的文,旨…

嵌入式学习--江协51单片机day2

今天学的不多,内容为:静态、动态数码管的控制,模块化编程和lcd1602调试工具 数码管的控制 由于内部电路的设计,数码管每次只能显示一个位置的一个数字,动态的实现是基于不同位置的闪烁频率高。 P2_4,P2_3,P2_2控制位…