如何利用python整合excel_使用 Python 合并多个格式一致的 Excel 文件(推荐)

一 问题描述

最近朋友在工作中遇到这样一个问题,她每天都要处理如下一批 Excel 表格:每个表格的都只有一个 sheet,表格的前两行为表格标题及表头,表格的最后一行是相关人员签字。最终目标是将每个表格的内容合并到一个 Excel 表格中,使之成为一张表格。在她未咨询我之前,每天复制粘贴这一类操作占用了她绝大部分时间。表格样式如下:

2019120913093366.jpg?201911913100

二 需求分析

根据她的描述,最终需求应该是这样的:在这一批表格中选取任意一个表格的前两行作为新表格的标题与表头,将这两行内容以嵌套列表的形式插入一个名为 data 空列表中。取每张表格的第3至倒数第二行,剔除空白行的内容。并将所有表格的内容以子列表的方式依次插入 data 列表中。任取一表格的最后一行以子列表的方式插入 data 列表中。最后将 data 列表的内容写入一个新的 Excel 表格中。

三 查阅资料

通过几分钟的上网查询,得出以下结论:

3.1 通过 xlrd 和 xlsxwriter 模块即可解决次需求;

3.2 之所以使用 xlrd 和 xlsxwriter 是因为: xlrd擅长读取 Excel 文件,不适合写入,用 xlsxwriter 来进行大规模写入 Excel 表格不会出现报错。

四 编码

一切以解决当前问题为向导,说干就干。 coding … …

# -*- coding:utf-8 -*-

import os, xlrd, xlsxwriter

source_dir = r'input'

new_execl = "All in one.xlsx"

raw_excels = os.listdir(source_dir)

keyword = "油站经理" # 除包括此关键字的行均插入

data = []

filename = os.path.join(source_dir, raw_excels[0])

wb = xlrd.open_workbook(filename)

sheet = wb.sheets()[0]

data.append(sheet.row_values(0))

data.append(sheet.row_values(1))

for excel in raw_excels:

filename = os.path.join(source_dir, excel)

wb = xlrd.open_workbook(filename)

sheet = wb.sheets()[0]

for row_num in range(2, sheet.nrows):

row_values = [str(i) for i in sheet.row_values(row_num)]

if len(''.join(row_values)) and (keyword not in ''.join(row_values)):

data.append(sheet.row_values(row_num))

data.append(sheet.row_values(sheet.nrows-1))

new_wb = xlsxwriter.Workbook(new_execl)

worksheet = new_wb.add_worksheet()

font = new_wb.add_format({"font_size":11})

for i in range(len(data)):

for j in range(len(data[i])):

worksheet.write(i, j, data[i][j], font)

new_wb.close()

半小时后,大功告成!

五 使用说明

5.1 下载安装 Python3.X(具体安装步骤自己查一下);

5.2 安装 xlrd 和 xlsxwriter 模块,参考命令: pip install xlrd xlsxwriter。开始此步骤之前可能需要先升级pip,具体升级命令系统会提示,复制粘贴即可;

5.3 新建一个名为 input 的文件夹,将需要合并的文件复制到这个文件夹下;

5.4 把以上代码复制以 excels_merge.py 的文件名保存在与 input 文件夹同级别的文件夹中,双击鼠标稍后即可。如果没有关联打开方式,那么就在资源管理器的地址栏输入“cmd”,在打开的命令窗口输入:python excels_merge.py。生成的 All in one.xlsx 即为合并后的新 Excel 文件。

六 总结

6.1 [str(i) for i in sheet.row_values(row_num)]这一部分代码实现了将列表内的元素统一转化为字符串,主要是为了下一行代码实现将列表转换为字符串;

6.3 此的脚本不对源 Excel 文件进行任何操作,可是放心使用;

6.4 以上脚本就是随手一写,都没有优化,以后如果数据量太大估计会考虑优化,希望大家多提意见或建议;

6.5 源代码可以访问我的同名 CSDN 博客及 GitHub 获取。

总结

以上所述是小编给大家介绍的使用 Python 合并多个格式一致的 Excel 文件,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

本文标题: 使用 Python 合并多个格式一致的 Excel 文件(推荐)

本文地址: http://www.cppcns.com/jiaoben/python/291599.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/476753.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

程序员面试金典 - 面试题 17.07. 婴儿名字(并查集)

1. 题目 每年,政府都会公布一万个最常见的婴儿名字和它们出现的频率,也就是同名婴儿的数量。 有些名字有多种拼法,例如,John 和 Jon 本质上是相同的名字,但被当成了两个名字公布出来。 给定两个列表,一个…

神经网络的简单偏好

文 | 许志钦知乎(已授权)源 | 天天机器学习作者注记我是2017年11月开始接触深度学习,至今刚好五年。2019年10月入职上海交大,至今三年,刚好第一阶段考核。2022年8月19号,我在第一届中国机器学习与科学应用大…

电影的音乐

Yann Tiersen,法国代表作:《天使爱美丽》《再见,列宁》 对于大家来说,一提到扬蒂尔森(Yann Tiersen)想到的便是《天使爱美丽》。的确《天使爱美丽》使这位法国音乐人一夜成为世界注目的艺术家。在我看来《天使爱美丽》的导演让皮埃尔热内(Jea…

python 列表写入csv_Python将字典数据写入CSV文件

# -*- coding: utf-8 -*- import os import time import csv class WriteCSV(): """定义成员变量""" def __init__(self): pass def init(self, info_list, info_dict_list): self.info_list info_list self.info_dict_list info_dict_list de…

数据结构--并查集(Disjoint-Set)

文章目录1. 并查集2. 操作2.1 初始化2.2 查询2.3 合并2.4 孤立3. 完整代码4. 相关题目5. 参考1. 并查集 并查集是一种树型的数据结构用于处理一些不相交集合(Disjoint Sets)的合并及查询问题 2. 操作 2.1 初始化 把每个点所在集合初始化为其自身&…

推特裁员大反转!马斯克哭求被裁员工回来

编 | Aeneas 好困源 | 新智元马斯克裁完一半员工后,发现推特运转不了了,现在正哭求一些人回来,堪称爽文情节了。打脸大戏来了!马斯克在上周五「灭掉」一半员工后,就后悔了。现在公司正在紧急联系数十名被裁的员工&…

Visual Studio 2008 Shell(翻译)

如果你现在在创建软件开发工具,你现在可以选择基于Visual Studio 2008 Shell。一个流行的Visual Studio 开发环境,Visual Studio Shell提供了一些核心功能,使你能够创建独一无二的应用程序,弹性的自定义能力帮助你推出更加特别的产…

word删除分节符后之前的格式乱了_办公室高级技能之Word邮件合并拆分

当我们需要批量生成名片,合同,成绩单等有相同内容的文件时,使用word邮件合并功能非常方便。如果你还需要把word文件发给不同的人就需要再拆分一下,用复制粘贴的方法拆分word,数量一多不仅效率低,还会因为文…

程序员面试金典 - 面试题 16.24. 数对和(双指针/哈希map)

文章目录1. 题目2. 解题2.1 排序双指针2.2 哈希map1. 题目 设计一个算法,找出数组中两数之和为指定值的所有整数对。一个数只能属于一个数对。 示例 1: 输入: nums [5,6,5], target 11 输出: [[5,6]]示例 2: 输入: nums [5,6,5,6], target 11 输出: [[5,6],[5…

ICLR 2023 最高分论文被锤抄袭??

文 | 智商掉了一地究竟是Git Clone还是Git Re-Basin?被评论区长文石锤!如上图所示,ICLR 2023 官方近期正式宣布评审工作已结束,评分最高的 Git Re-Basin 这项神经网络启发性新研究探索了在深度学习中,SGD算法在高维非凸…

新浪的图片新闻效果

<html><head><title>新浪的图片新闻效果</title><meta http-equiv"Content-Type"content"text/html; charsetgb2312"></head><body bgcolor"#FFFFFF"text"#000000"><p> </p>&l…

机器学习方法_机器学习模型应用方法综述

文章发布于公号【数智物语】 &#xff08;ID&#xff1a;decision_engine&#xff09;&#xff0c;关注公号不错过每一篇干货。来源 | 数据派THU&#xff08;id&#xff1a;DatapiTHU&#xff09;作者&#xff1a;Julien Kervizic翻译&#xff1a;陈之炎 校对&#xff1a;李海明…

程序员面试金典 - 面试题 16.21. 交换和(哈希set)

1. 题目 给定两个整数数组&#xff0c;请交换一对数值&#xff08;每个数组中取一个数值&#xff09;&#xff0c;使得两个数组所有元素的和相等。 返回一个数组&#xff0c;第一个元素是第一个数组中要交换的元素&#xff0c;第二个元素是第二个数组中要交换的元素。 若有多…

来,教你成为科研卷王

作为曾经熬通宵肝论文的过来人&#xff0c;小编要吐槽&#xff0c;论文写久了真的会头秃&#xff0c;尤其是确定选题和创新点的时候&#xff0c;是薅头发事件的高发阶段。对于那些导师放养、在自己的摸索中磕磕绊绊前行的科研新手们&#xff0c;焦虑总是瞅准时机就扑面而来——…

DEBUG主要命令(转)

1、如何调用DEBUG程序语法格式&#xff1a;DEBUG &#xff3b;驱动器名&#xff1a;&#xff3d;&#xff3b;路径&#xff3d;&#xff3b;文件名&#xff3d;如有文件名&#xff0c;则将指定的文件调入内存。如命令中没有指定文件名&#xff0c;则DEBUG可以与正在内存中的内…

python手机编译器可以干什么_Python是什么?Python学习用哪些编译器?

Python是什么&#xff1f;Python是一个非常好用的程序语言&#xff0c;开发的速度非常快。Python的设计哲学是优雅、明确、简单。因此&#xff0c;Perl语言中总是有多种方法来做同一件事的理念在Python开发者中通常是难以忍受的。 Python开发者的哲学是用一种方法&#xff0c;最…

程序员面试金典 - 面试题 16.16. 部分排序(排序/不排序)

文章目录1. 题目2. 解题2.1 排序2.2 不排序1. 题目 给定一个整数数组&#xff0c;编写一个函数&#xff0c;找出索引 m 和 n &#xff0c;只要将索引区间 [m,n] 的元素排好序&#xff0c;整个数组就是有序的。 注意&#xff1a;n-m 尽量最小&#xff0c;也就是说&#xff0c;找…

福州公交车与拖拉机相撞1人死亡

2007年7月3日下午17时许&#xff0c;福州地区大学新校区学园路路段发生一起交通事故。郑久忠(男&#xff0c;35岁&#xff0c;鼓楼区八一七中路734号弄一号)驾驶41路公交车沿学园路由北往南行驶&#xff0c;途经厚庭路和学园路交叉路口&#xff0c;与林亮(男&#xff0c;34岁&a…

综述|视觉Transformer在CV中的现状、趋势和未来方向

文 | 汽车人源 | 自动驾驶之心摘要Transformer&#xff0c;一种基于注意力的编码器-解码器模型&#xff0c;已经彻底改变了自然语言处理&#xff08;NLP&#xff09;领域。受这些重大成就的启发&#xff0c;最近在计算机视觉&#xff08;CV&#xff09;领域采用类似Transformer…

python变量定义问题_python 定义n个变量方法 (变量声明自动化)

python 定义n个变量方法 (变量声明自动化) code&#xff1a; for i in range(100): cmd "t%s 1" % i exec cmd eval("t%s" % i) print t10 输出 1 &#xff0c; 表示我们创建了 t0 - t99 这样的变量 以上这篇python 定义n个变量方法 (变量声明自动化)就是…