其他分享
首页 > 其他分享> > 自动化特征选择

自动化特征选择

作者:互联网

⭐在添加新特征或处理一般的的高维数据集,最好将特征的数量减少到只包含最有用的那些特征,并删除其余特征
然而,如何判断每个特征的作用呢?
三种基本的策略:
1、单变量统计
2、基于模型的选择
3、迭代选择

这些都是监督方法,需要划分测试集和训练集,并旨在训练集上拟合特征选择

1、单变量统计

⭐我们计算每个特征和目标值之间的关系是否存在统计显著性,并选择最高置信度的特征。

sklearn中使用单变量特征选择:
1、选择一项测试:f_classif/f_regresion
2、确定p值,选择一种舍弃特征的方法(舍弃p值过大的特征)

标签:False,特征选择,特征,train,自动化,test,True,select
来源: https://www.cnblogs.com/caolanying/p/16295625.html