Pandas 对数值进行分箱操作的4种方法总结对比
作者:互联网
分箱是一种常见的数据预处理技术有时也被称为分桶或离散化,他可用于将连续数据的间隔分组到“箱”或“桶”中。在本文中,我们将讨论使用 python Pandas 库对数值进行分箱的 4 种方法。
我们创建以下合成数据用于演示
import pandas as pd # version 1.3.5
import numpy as np
def create_df():
df = pd.DataFrame({'score': np.random.randint(0,101,1000)})
return df
create_df()
df.head()
数据包括 1000 名学生的 0 到 100 分的考试分数。而这次的任务是将数字分数分为值“A”、“B”和“C”的等级,其中“A”是最好的,“C”是最差的。
1、between & loc
完整文章:
https://avoid.overfit.cn/post/dc11c84491e841dea928d652f0f93005
标签:分箱,df,create,数值,pd,np,import,Pandas 来源: https://www.cnblogs.com/deephub/p/16217872.html