达观杯linghtgbm(五)
作者:互联网
达观杯linghtgbm
1.linghtgbm
LightGBM是个快速的,分布式的,高性能的基于决策树算法的梯度提升框架。可用于排序,分类,回归以及很多其他的机器学习任务中。
在竞赛题中,我们知道XGBoost算法非常热门,它是一种优秀的拉动框架,但是在使用过程中,其训练耗时很长,内存占用比较大。在2017年年1月微软在GitHub的上开源了一个新的升压工具–LightGBM。在不降低准确率的前提下,速度提升了10倍左右,占用内存下降了3倍左右。因为他是基于决策树算法的,它采用最优的叶明智策略分裂叶子节点,然而其它的提升算法分裂树一般采用的是深度方向或者水平明智而不是叶,明智的。因此,在LightGBM算法中,当增长到相同的叶子节点,叶明智算法比水平-wise算法减少更多的损失。因此导致更高的精度,而其他的任何已存在的提升算法都不能够达。与此同时,它的速度也让人感到震惊,这就是该算法名字 灯 的原因。
2.linghtgbm代码实现
import lightgbm as lgb
import pandas as pd
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
fp = open('data_w_tfidf.pkl', 'rb')
x_train,y_train=pickle.load(fp)
x_train,x_test,y_train,y_test=train_test_split(x_train,y_train,test_size=0.3, random_state=100)
# 训练 cv and train
estimator = lgb.sklearn.LGBMClassifier(num_leaves=31,learning_rate=0.05,n_estimators=20) # 训练数据需要参数列表和数据集
estimator.fit(x_train,y_train)
y_pred = estimator.predict(x_test)
print("f值",f1_score(y_test,y_pred,average='micro'))
原文:https://blog.csdn.net/huacha__/article/details/81057150
标签:linghtgbm,score,明智,算法,train,test,达观 来源: https://blog.csdn.net/weixin_41781408/article/details/89292860