利用Pandas合并多个csv文件并去重【转】
作者:互联网
1 import os 2 import pandas as pd 3 4 path = 'c:/1' #设置csv所在文件夹 5 files = os.listdir(path) #获取文件夹下所有文件名 6 7 df1 = pd.read_csv(path + '/' + files[0],encoding='gbk') #读取首个csv文件,保存到df1中 8 9 for file in files[1:]: 10 df2 = pd.read_csv(path +'/' + file,encoding='gbk') #打开csv文件,注意编码问题,保存到df2中 11 df1 = pd.concat([df1,df2],axis=0,ignore_index=True) #将df2数据与df1合并 12 13 df1 = df1.drop_duplicates() #去重 14 df1 = df1.reset_index(drop=True) #重新生成index 15 df1.to_csv(path + '/' + 'total.csv') #将结果保存为新的csv文件
【转自】https://www.jianshu.com/p/0ee48403983b
标签:files,合并,df1,df2,pd,path,csv,Pandas 来源: https://www.cnblogs.com/niuniu238/p/14343789.html