其他分享
首页 > 其他分享> > sklearn库的学习

sklearn库的学习

作者:互联网

参考

python机器学习笔记:sklearn库的学习
https://www.cnblogs.com/wj-1314/p/10179741.html

正则化 normalize

X = [[ 1., -1.,  2.],
     [ 2.,  0.,  0.],
     [ 0.,  1., -1.]]
X_normalized = preprocessing.normalize(X, norm='l2')
>>> X_normalized
array([[ 0.40824829, -0.40824829,  0.81649658],
       [ 1.        ,  0.        ,  0.        ],
       [ 0.        ,  0.70710678, -0.70710678]])
>>> 0.40824829**2 + (-0.40824829)**2 + 0.81649658**2
0.9999999977275447
>>> 1+1+4
6
>>> 1/6
0.16666666666666666
>>> 1/np.sqrt(6)
0.4082482904638631

one-hot 编码

>>> data = [[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]]
>>> encoder = preprocessing.OneHotEncoder().fit(data)
encoder.transform(data).toarray()
array([[1., 0., 1., 0., 0., 0., 0., 0., 1.],
       [0., 1., 0., 1., 0., 1., 0., 0., 0.],
       [1., 0., 0., 0., 1., 0., 1., 0., 0.],
       [0., 1., 1., 0., 0., 0., 0., 1., 0.]])

标签:sklearn,学习,preprocessing,L2,0.40824829,范数,data,属性
来源: https://www.cnblogs.com/boyang987/p/14675901.html