Estimators

首页 > TAG信息列表 > Estimators

【Ryo】Python：随机森林及参数优化——基于Kaggle的实战详解

机器学习在目前数字金融领域具有重要的地位，因此学习各类ML方法对于解决金融识别、信用评估、政策判断有很大的帮助作用。本文是我偶然间发现Kaggle上最新的一个dataset，基于此贷款数据loandata进行了相关的Python操作，利用随机森林的集成方法解决金融政策判断的问题，同时进行了

Untitled-0720记录一次机器学习完整项目

文章目录前言GET DATA梳理标量数据描述性统计训练数据：划分使用`StratifiedShuffleSplit`进行分层采样数据探索相关系数属性组合试验 Prepare the data for Machine Learning algorithms数据清洗处理标量数据创建自己的类特征缩放转换流水线选择并训练模型交叉验证模

sklearn模型使用贝叶斯优化调参

文章目录 1. 构造数据源2. 构造黑盒目标函数3. 确定取值空间4. 构造贝叶斯优化器5. 运行，导出结果与最优参数全部代码贝叶斯优化github地址：https://github.com/fmfn/BayesianOptimization paper地址：http://papers.nips.cc/paper/4522-practical-bayesian%20-optimizatio

ML之xgboost：利用xgboost算法(sklearn+GridSearchCV)训练mushroom蘑菇数据集(22+1,6513+1611)来预测蘑菇是否毒性(二分类预测)

ML之xgboost：利用xgboost算法(sklearn+GridSearchCV)训练mushroom蘑菇数据集(22+1,6513+1611)来预测蘑菇是否毒性(二分类预测) 目录输出结果设计思路核心代码更多输出输出结果正在更新…… 设计思路正在更新…… 核心代码 from sklearn.grid_s

ML之回归预测：利用两种机器学习算法(LiR，XGBoost(调优+重要性可视化+特征选择模型))对无人驾驶汽车系统参数(2017年的data,18+2)进行回归预测值VS真实值

ML之回归预测：利用两种机器学习算法(LiR，XGBoost(调优+重要性可视化+特征选择模型))对无人驾驶汽车系统参数(2017年的data,18+2)进行回归预测值VS真实值目录输出结果 1、LiR模型 2、XGBoost模型输出结果 1、LiR模型 LiR：The value of default measurem

04-04 AdaBoost算法代码(鸢尾花分类)

目录AdaBoost算法代码(鸢尾花分类)一、导入模块二、导入数据三、构造决策边界四、训练模型4.1 训练模型(n_e=10, l_r=0.8)4.2 可视化4.3 训练模型(n_estimators=300, learning_rate=0.8)4.4 训练模型(n_estimators=300, learning_rate=0.5)4.5 训练模型(n_estimators=600, learning

随机森林分类给出每一个类别的概率

上一篇介绍了决策树，如何给出类别概率，那么很自然就想了随机森林。细节不说了，直接看代码。 from sklearn.datasets import load_iris from sklearn import tree from sklearn.ensemble import RandomForestClassifier import numpy as np import graphviz x = load_iris().data

04-04 AdaBoost算法代码(鸢尾花分类)

目录AdaBoost算法代码(鸢尾花分类)一、导入模块二、导入数据三、构造决策边界四、训练模型4.1 训练模型(n_e=10, l_r=0.8)4.2 可视化4.3 训练模型(n_estimators=300, learning_rate=0.8)4.4 训练模型(n_estimators=300, learning_rate=0.5)4.5 训练模型(n_estimators=600, learni

机器学习集成学习篇——python实现Bagging和AdaBOOST算法

机器学习集成学习篇——python实现Bagging和AdaBOOST算法摘要Bagging算法Adaboost算法摘要本文通过python实现了集成学习中的Bagging和AdaBOOST算法，并将代码进行了封装，方便读者调用。 Bagging算法 import numpy as np import pandas as pd class Cyrus_bagging(object):

Google开发者大会：你不得不知的Tensorflow小技巧

Google Development Days China 2018近日在中国召开了。非常遗憾，小编因为不可抗性因素滞留在合肥，没办法去参加。但是小编的朋友有幸参加了会议，带来了关于tensorlfow的一手资料。这里跟随小编来关注tensorflow在生产环境下的最佳应用情况。 Google Brain软件工程师冯亦菲为我们带

关于RandomForestRegressor

RandomForest的分类类是RandomForestClassifier，而RandomForestRegressor属于回归类参数 - n_estimators 也就是弱学习器的最大迭代次数，或者说最大的弱学习器的个数，默认是10。一般来说n_estimators太小，容易欠拟合，n_estimators太大，又容易过拟合，一般选择一个适中的数值 - n_jobs 默

随机森林在乳腺癌数据上的调参

　　这篇文章中，使用基于方差和偏差的调参方法，在乳腺癌数据上进行一次随机森林的调参。乳腺癌数据是sklearn自带的分类数据之一。　　案例中，往往使用真实数据，为什么我们要使用sklearn自带的数据呢？因为真实数据在随机森林下的调参过程，往往非常缓慢。真实数据量大，维度高，在使用随机森