其他分享
首页 > 其他分享> > 数据的区间量化

数据的区间量化

作者:互联网

 

1.

2.分位数分箱

固定宽度的分箱容易计算,但是如果计数值中有比较大的缺口,就会产生很多没有任何数据的空箱子。根据数据的分布特点,进行自适应的箱体定位,就可以解决这个问题。这种方法可以使用数据分布的分位数来实现。

分位数:分位数是将数据划分为相等的若干分数的值。例如,中位数(即二分位数)可以将数据划分为两半,其中一半数据值比中位数小,另一半数据点比中位数大。四分位数将数据四等分,十分位将数据十等分。

标签:分箱,中位数,空箱子,划分,位数,区间,量化,数据
来源: https://www.cnblogs.com/yuweng1689/p/13653609.html