其他分享
首页 > 其他分享> > Datawhale 零基础入门数据挖掘二手车预测task03

Datawhale 零基础入门数据挖掘二手车预测task03

作者:互联网

Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK1

使用语言:python

Tas1 – Task5

Task2 特征工程分析

1.学习了本次介绍的关于异常值处理的代码包装模块,感觉大佬还是强

在这里插入图片描述

2.关于分桶的概念与运用

定义:分桶是离散化的常用方法,将连续型特征离线化为一系列 0/1 的离散特征;当数值特征跨越不同的数量级的时候,模型可能会只对大的特征值敏感,这种情况可以考虑分桶操作。分桶操作可以看作是对数值变量的离散化,之后通过二值化进行 one-hot 编码。
优势:

等距分桶

等频分桶

3.特征筛选

需要对以上三种方法的汇总比较(下次更新)

标签:分桶,特征,Datawhale,离散,表达能力,位数,数据挖掘,task03,pandas
来源: https://blog.csdn.net/lolin99/article/details/115876188