lightgbm使用(七)特征工程2
作者:互联网
参考这个文章,把相关的重要特征相乘 作为一个新特征
2020招商银行fintech数据赛,线上0.78026,最终53名~~菜鸡分享 - 知乎 (zhihu.com)
# 当月公司存款平均每日结余 * 当年公司需求存款平均每日结余 # 降效 # XX['level1']=XX['CUR_MON_COR_DPS_MON_DAY_AVG_BAL'] * XX['CUR_YEAR_COR_DMND_DPS_DAY_AVG_BAL']/10**12 # X_testAA['level1']=X_testAA['CUR_MON_COR_DPS_MON_DAY_AVG_BAL'] * X_testAA['CUR_YEAR_COR_DMND_DPS_DAY_AVG_BAL']/10**12 # 注册时间 * 当年公司需求存款平均每日结余 # 提升一个万分位 XX['level1']=XX['REG_DT'] * XX['CUR_YEAR_COR_DMND_DPS_DAY_AVG_BAL']/10**8 X_testAA['level1']=X_testAA['REG_DT'] * X_testAA['CUR_YEAR_COR_DMND_DPS_DAY_AVG_BAL']/10**8
# 降效 XX['level2']=XX['REG_DT'] * XX['CUR_MON_COR_DPS_MON_DAY_AVG_BAL']/10**8 X_testAA['level2']=X_testAA['REG_DT'] * X_testAA['CUR_MON_COR_DPS_MON_DAY_AVG_BAL']/10**8
看来要够造相关的、有用的特征。
链接文章:信用卡天数、借记卡天数、信用卡等级等一系列特征相互乘
明天尝试大量构造特征
尝试删除离群点,尝试删除不重要的特征
参考:
特征工程系列:(五)特征构造 - Neo0oeN - 博客园 (cnblogs.com)
特征工程系列:聚合特征构造以及转换特征构造 - 大咖驾到 - 博客园 (cnblogs.com)
2020招商银行fintech数据赛,线上0.78026,最终53名~~菜鸡分享 - 知乎 (zhihu.com)
这个也有:机器学习算法(三)基于LightGBM的分类预测 - 知乎 (zhihu.com) 一些特征两两组合后对于数据的划分能力也有提升。
这个也有:机器学习算法(二): 基于XGBoost的分类预测 - 知乎 (zhihu.com) 利用箱型图我们也可以得到不同类别在不同特征上的分布差异情况。我们可以发现Sunshine,Humidity3pm,Cloud9am,Cloud3pm的区分能力较强
标签:COR,lightgbm,工程,特征,XX,MON,testAA,DPS,AVG 来源: https://www.cnblogs.com/1container/p/16244622.html