首页 > TAG信息列表 > Estimators

【Ryo】Python:随机森林及参数优化——基于Kaggle的实战详解

机器学习在目前数字金融领域具有重要的地位,因此学习各类ML方法对于解决金融识别、信用评估、政策判断有很大的帮助作用。本文是我偶然间发现Kaggle上最新的一个dataset,基于此贷款数据loandata进行了相关的Python操作,利用随机森林的集成方法解决金融政策判断的问题,同时进行了

Untitled-0720记录一次机器学习完整项目

文章目录 前言GET DATA梳理标量数据描述性统计训练数据:划分使用`StratifiedShuffleSplit`进行分层采样数据探索相关系数属性组合试验 Prepare the data for Machine Learning algorithms数据清洗处理标量数据创建自己的类 特征缩放转换流水线选择并训练模型交叉验证 模

sklearn模型使用贝叶斯优化调参

文章目录 1. 构造数据源2. 构造黑盒目标函数3. 确定取值空间4. 构造贝叶斯优化器5. 运行,导出结果与最优参数全部代码 贝叶斯优化github地址:https://github.com/fmfn/BayesianOptimization paper地址:http://papers.nips.cc/paper/4522-practical-bayesian%20-optimizatio

ML之xgboost:利用xgboost算法(sklearn+GridSearchCV)训练mushroom蘑菇数据集(22+1,6513+1611)来预测蘑菇是否毒性(二分类预测)

ML之xgboost:利用xgboost算法(sklearn+GridSearchCV)训练mushroom蘑菇数据集(22+1,6513+1611)来预测蘑菇是否毒性(二分类预测)     目录 输出结果 设计思路 核心代码 更多输出         输出结果 正在更新……   设计思路 正在更新……   核心代码 from sklearn.grid_s

ML之回归预测:利用两种机器学习算法(LiR,XGBoost(调优+重要性可视化+特征选择模型))对无人驾驶汽车系统参数(2017年的data,18+2)进行回归预测值VS真实值

ML之回归预测:利用两种机器学习算法(LiR,XGBoost(调优+重要性可视化+特征选择模型))对无人驾驶汽车系统参数(2017年的data,18+2)进行回归预测值VS真实值       目录 输出结果 1、LiR模型 2、XGBoost模型             输出结果 1、LiR模型 LiR:The value of default measurem

04-04 AdaBoost算法代码(鸢尾花分类)

目录AdaBoost算法代码(鸢尾花分类)一、导入模块二、导入数据三、构造决策边界四、训练模型4.1 训练模型(n_e=10, l_r=0.8)4.2 可视化4.3 训练模型(n_estimators=300, learning_rate=0.8)4.4 训练模型(n_estimators=300, learning_rate=0.5)4.5 训练模型(n_estimators=600, learning

随机森林分类给出每一个类别的概率

上一篇介绍了决策树,如何给出类别概率,那么很自然就想了随机森林。细节不说了,直接看代码。 from sklearn.datasets import load_iris from sklearn import tree from sklearn.ensemble import RandomForestClassifier import numpy as np import graphviz x = load_iris().data

04-04 AdaBoost算法代码(鸢尾花分类)

目录AdaBoost算法代码(鸢尾花分类)一、导入模块二、导入数据三、构造决策边界四、训练模型4.1 训练模型(n_e=10, l_r=0.8)4.2 可视化4.3 训练模型(n_estimators=300, learning_rate=0.8)4.4 训练模型(n_estimators=300, learning_rate=0.5)4.5 训练模型(n_estimators=600, learni

机器学习 集成学习篇——python实现Bagging和AdaBOOST算法

机器学习 集成学习篇——python实现Bagging和AdaBOOST算法摘要Bagging算法Adaboost算法 摘要 本文通过python实现了集成学习中的Bagging和AdaBOOST算法,并将代码进行了封装,方便读者调用。 Bagging算法 import numpy as np import pandas as pd class Cyrus_bagging(object):

Google开发者大会:你不得不知的Tensorflow小技巧

Google Development Days China 2018近日在中国召开了。非常遗憾,小编因为不可抗性因素滞留在合肥,没办法去参加。但是小编的朋友有幸参加了会议,带来了关于tensorlfow的一手资料。这里跟随小编来关注tensorflow在生产环境下的最佳应用情况。 Google Brain软件工程师冯亦菲为我们带

关于RandomForestRegressor

RandomForest的分类类是RandomForestClassifier,而RandomForestRegressor属于回归类 参数 - n_estimators 也就是弱学习器的最大迭代次数,或者说最大的弱学习器的个数,默认是10。一般来说n_estimators太小,容易欠拟合,n_estimators太大,又容易过拟合,一般选择一个适中的数值 - n_jobs 默

随机森林在乳腺癌数据上的调参

  这篇文章中,使用基于方差和偏差的调参方法,在乳腺癌数据上进行一次随机森林的调参。乳腺癌数据是sklearn自带的分类数据之一。   案例中,往往使用真实数据,为什么我们要使用sklearn自带的数据呢?因为真实数据在随机森林下的调参过程,往往非常缓慢。真实数据量大,维度高,在使用随机森