其他分享
首页 > 其他分享> > lightgbm使用(七)特征工程2

lightgbm使用(七)特征工程2

作者:互联网

参考这个文章,把相关的重要特征相乘 作为一个新特征

2020招商银行fintech数据赛,线上0.78026,最终53名~~菜鸡分享 - 知乎 (zhihu.com)

# 当月公司存款平均每日结余 * 当年公司需求存款平均每日结余
# 降效
# XX['level1']=XX['CUR_MON_COR_DPS_MON_DAY_AVG_BAL'] * XX['CUR_YEAR_COR_DMND_DPS_DAY_AVG_BAL']/10**12
# X_testAA['level1']=X_testAA['CUR_MON_COR_DPS_MON_DAY_AVG_BAL'] * X_testAA['CUR_YEAR_COR_DMND_DPS_DAY_AVG_BAL']/10**12

# 注册时间 * 当年公司需求存款平均每日结余 
# 提升一个万分位
XX['level1']=XX['REG_DT'] * XX['CUR_YEAR_COR_DMND_DPS_DAY_AVG_BAL']/10**8
X_testAA['level1']=X_testAA['REG_DT'] * X_testAA['CUR_YEAR_COR_DMND_DPS_DAY_AVG_BAL']/10**8

 

# 降效
XX['level2']=XX['REG_DT'] * XX['CUR_MON_COR_DPS_MON_DAY_AVG_BAL']/10**8
X_testAA['level2']=X_testAA['REG_DT'] * X_testAA['CUR_MON_COR_DPS_MON_DAY_AVG_BAL']/10**8

 

看来要够造相关的、有用的特征。

链接文章:信用卡天数、借记卡天数、信用卡等级等一系列特征相互乘

明天尝试大量构造特征

尝试删除离群点,尝试删除不重要的特征

 参考:

特征工程系列:(五)特征构造 - Neo0oeN - 博客园 (cnblogs.com)

特征工程系列:聚合特征构造以及转换特征构造 - 大咖驾到 - 博客园 (cnblogs.com)

2020招商银行fintech数据赛,线上0.78026,最终53名~~菜鸡分享 - 知乎 (zhihu.com)

这个也有:机器学习算法(三)基于LightGBM的分类预测 - 知乎 (zhihu.com)  一些特征两两组合后对于数据的划分能力也有提升。

这个也有:机器学习算法(二): 基于XGBoost的分类预测 - 知乎 (zhihu.com)  利用箱型图我们也可以得到不同类别在不同特征上的分布差异情况。我们可以发现Sunshine,Humidity3pm,Cloud9am,Cloud3pm的区分能力较强

标签:COR,lightgbm,工程,特征,XX,MON,testAA,DPS,AVG
来源: https://www.cnblogs.com/1container/p/16244622.html