Pandas 数据重复处理 duplicated()和drop_duplicates()
作者:互联网
文章目录
duplicated()和drop_duplicates()
导库
import pandas as pd
import numpy as np
创建数据集
x=np.array([[1,2,3],[3,4,5],[1,2,3],[1,2,3]])
x=pd.DataFrame(x)
x
duplicated()
返回每行数据是否重复
x.duplicated()
计算重复数据数目
x.duplicated().sum()
drop_duplicates()
删除重复值
x=x.drop_duplicates()
x
标签:duplicates,drop,重复,pd,数据,Pandas,duplicated 来源: https://blog.csdn.net/m0_47256162/article/details/113789388