项目四:数据获取:合并excel
作者:互联网
合并excel
直接上代码
- 可以自动合并一个文件夹下所有xlsx,亲测可用
# 下面这些变量需要您根据自己的具体情况选择
# ['岗位名称','公司全名','备注','薪资','年薪','工作地点','学历要求','工作年限']
import os
import pandas as pd
import xlrd
# 注意这里的 xlsx 文件内容不同(如果相同的话合并干嘛) 但格式是一样的
# 每个文件一个只有 sheet1 有内容 其他地方空白
# 在 path 下 找出所有符合要求的文件
def file(path):
name = [] # 存放符合要求的 xlsx 文件
a = os.listdir(path) # 找出所有的文件
for b in a:
if os.path.splitext(b)[1] == ".xlsx" : # 利用分割判断 结尾
name.append(b) # 将符合要求的文件 放入定义的列表 并返回
return name
lj = r'E:\百度网盘下载\0备份' # 存放文件夹的 路径
c = file(lj)
data = []
for i in c:
# 循环符合要求的文件
text = xlrd.open_workbook(lj + "\\" + i) # 将循环 读出 放入变量
sheet1 = text.sheets()[0] # xlsx文件中 内容都在 sheet1 中
hang = sheet1.nrows # 行数
# title = sheet1.row_values(0) # 两个文件的 表头一样
title = ['岗位名称','公司全名','备注','薪资','年薪','工作地点','学历要求','工作年限']
for g in range(0,hang):
data.append(sheet1.row_values(g))
content = pd.DataFrame(data) # 转换格式
content.columns = title
content.to_excel(lj + "\\" + "new.xlsx",index=None,encoding='utf-8') # 给合并后的文件重新命名
print("文件合并完成")
标签:文件,xlsx,合并,符合要求,excel,获取,sheet1,path,lj 来源: https://blog.csdn.net/qq_42066782/article/details/114185569