前述知识见二值变量间的相关性分析
dc系数,这里作者是用自己名字命名,也是区分度相关系数的一个缩写。
关于dc系数的表达式我们可以使用如下的表达式,该表达式要比第一个表达式更优。因为区分度d实际上是一个平方项,开发之后的sqrt(d)能更好的刻画区分度,所以dc系数为:
即我们用新的区分度sqrt(d)来代替之前的区分度d。
同样的数据运行结果为:
标签:系数,变量,dc,sqrt,相关性,二值,区分度,表达式
来源: https://blog.51cto.com/u_15228753/2819774