其他分享
首页 > 其他分享> > Scikit-learn_数据预处理

Scikit-learn_数据预处理

作者:互联网

一.标准化

描述

为了避免某一个动态范围过大的特征列对计算结果造成影响,同时可以提升模型精度,标准化的实质是对样本集的每个特征列减去该特征列均值进行中心化,再除以标准差进行缩放

实例

二.归一化

描述

用数据集各个特征的最小值进行中心化后,再按极差(最大值-最小值)进行缩放,即数据减去特征列的最小值,并且会被收敛到区间[0, 1]内,这个过程就是归一化

实例

三.正则化

描述

正则化是将每个数据样本的范数单位化,是对数据集的行操作

用法和参数

实例

四.离散化

描述

离散化是将连续特征划分为离散特征值

实例

五.特征编码

描述

用来把n个标称型特征转换为0到n-1的整数编码。

实例

六.缺失值补全

描述

缺失值补全可以基于一个特征列的非缺失值来插补该特征列中的缺失值,也就是单变量插补

实例

标签:pp,scaler,Scikit,transform,train,learn,np,import,预处理
来源: https://blog.csdn.net/feizuiku0116/article/details/120114904