首页 > TAG信息列表 > 泰坦尼克号
机器学习—决策树
泰坦尼克号沉没是历史上最臭名昭着的沉船之⼀。 1912年4⽉ 15⽇ , 在她的处⼥航中, 泰坦尼克号在与冰⼭相撞后沉没, 在2224名乘客和机组⼈员中造成1502⼈死亡。 这场耸⼈听闻的悲剧震惊了国际社会, 并为船舶制定了更好的安全规定。 造成海难失事的原因之⼀是乘客和机组⼈员没有⾜够的【项目实战】泰坦尼克号的幸存者预测
前言 这是学习视频中留下来的一个作业,我决定根据大佬的步骤来一步一步完成整个项目,项目的下载地址如下:https://www.kaggle.com/c/titanic/data 大佬的传送门:https://zhuanlan.zhihu.com/p/338974416 查看数据 首先我们打开训练集,看到的数据如下 我们可以看到这个数据集里面的特征学习笔记 — Datawhale数据分析入门Task04
五、数据可视化 1、【思考】最基本的可视化图案有哪些?分别适用于那些场景? 可视化的场景可以分为五大类:展示趋势变化、展示分布关系、展示相关关系、展示排序信息、展示组成关系。 柱状图 反映一个类别变量和一个数值变量之间的关系散点图反映数值型变量之间的相关性折线图反映十、决策树算法简介-泰坦尼克号乘客生存预测
python编程快速上手(持续更新中…) 文章目录 python编程快速上手(持续更新中…)4.1 决策树算法简介概述 4.2 决策树分类原理1 熵1.1 概念1.2 案例 2 决策树的划分依据一------信息增益2.1 概念2.2 案例: 3 决策树的划分依据二----信息增益率4 决策树的划分依据三——基尼值和基7000字,Python数据分析:泰坦尼克号中女生更容易生还?
作者 | Peter 来源 | 尤而小屋 Titanic数据是一份经典数据挖掘的数据集,本文介绍的是kaggle排名第一的案例分享。原notebook地址: https://www.kaggle.com/startupsci/titanic-data-science-solutions 排名 看下这个案例的排名情况: 第一名和第二名的差距也不是很多,而且第二名【机器学习】决策树案例三:利用决策树进行泰坦尼克号事故人员存活分类预测
利用决策树进行泰坦尼克号事故人员存活分类预测 3 利用决策树进行泰坦尼克号事故人员存活分类预测3.1 导入模块与加载数据3.2 特征工程3.3 划分数据3.4 模型创建与应用3.5 模型可视化3.6 参数自动搜索 手动反爬虫,禁止转载: 原博地址 https://blog.csdn.net/lys_828/artic从零开始数据分析Kaggle项目——泰坦尼克号(五)
从零开始数据分析Kaggle项目—泰坦尼克号2—2.1 # title: "Kaggle项目泰坦尼克号 2__2.1" # author: "小鱼" # date: "2021-12-17" import pandas as pd import numpy as np df = pd.read_csv("train.csv") # 查看每个特征缺失值个数 df.isna().sum() df.info() <cla决策树算法6-案例:泰坦尼克号乘客生存预测
1 案例背景 泰坦尼克号沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会,并为船舶制定了更好的安全规定。 造成海难失事的原因之一是乘客和机组人员没有足够泰坦尼克号乘客生存预测(XGBoost)
泰坦尼克号乘客生存预测(XGBoost) 1. 案例背景2. 步骤分析3. 代码实现 1. 案例背景 泰坦尼克号沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会,并泰坦尼克号旅客生存预测记录
在指定网址下载文件,并放到指定目录 import urllib.request import os url = "xxxxx" data_path = "D:/xxx" if not os.path.isfile(data_path): # 如果不存在文件 ret = urllib.request.urlretrieve(url, data_path) #则下载 print("Download: ", ret) eDatawhale7月组队学习task4数据可视化
Datawhale7月task4数据可视化 准备工作 **复习:**回顾学习完第一章,我们对泰坦尼克号数据有了基本的了解,也学到了一些基本的统计方法,第二章中我们学习了数据的清理和重构,使得数据更加的易于理解;今天我们要学习的是第二章第三节:数据可视化,主要给大家介绍一下Python数据可视化库Datawhale动手学习数据分析-Task4
数据可视化 导入相关库: import pandas as pd import numpy as np import matplotlib.pyplot as plt 导入数据: text = pd.read_csv(r'result.csv') text.head() # 可视化展示泰坦尼克号数据集中男女中生存人数分布情况 sex = text.groupby('Sex')['Survived'].sum() sex.plot.barTask04:数据可视化
第二章 3 数据可视化3.1 如何让人一眼看懂你的数据?3.1.1 了解matplotlib,自己创建一个数据项,对其进行基本可视化3.1.2 可视化展示泰坦尼克号数据集中男女中生存人数分布情况(用柱状图)3.1.3 可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图(用柱状图试试)3.1.4 可Kaggle泰坦尼克号比赛项目详解
Kaggle泰坦尼克号比赛项目详解 项目背景目标数据字典一、基础字段二、衍生字段(部分,在后续代码中补充) 特征工程特征分析一、导入必要库二、导入数据三、查看数据四、查看字段信息五、查看字段统计数据六、查看船舱等级与幸存量的关系七、查看性别与幸存情况的关系八、查看乘kaggle泰坦尼克数据之模型建立和评估
第三章 模型搭建和评估–建模 经过前面的两章的知识点的学习,我可以对数数据的本身进行处理,比如数据本身的增删查补,还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据,我们做数据分析的目的也就是,运用我们的数据以及结合自研数据分析工具——yandas系列一:分析泰坦尼克号沉船事件中的乘客信息表
前言:前言:21年广州荔湾区成了疫情灾区,很多人都没有工作,被居家隔离,感染病毒概率死亡率是0.005%,没有工作死亡率是100%,因此作为普通老百姓,自己开发了一个数据分析工具,叫yandas。 首先我们看看表: 第一个字段就是是否生还,第二个是姓名,然后性别,年龄 从表中可以看出地址相同的,票号也决策树API、泰坦尼克号生存预测案例
一、决策树API 在sklearn中使用sklearn.tree.DecisionTreeClassifier(criterion=’gini’, max_depth=None,random_state=None)构建决策树 其中: criterion 特征选择标准"gini"或者"entropy",前者代表基尼系数,后者代表信息增益。一默认"gini",即CART算法。min_samples_split 内部节【决策树】泰坦尼克号幸存者预测项目
项目目标 泰坦尼克号的沉没是历史上最著名的还难事件之一,在船上的2224名乘客和机组人员中,共造成1502人死亡。本次项目的目标是运用机器学习工具来预测哪些乘客能够幸免于难。 项目过程 导入并探索数据 处理缺失值,删除与预测无关的特征 将分类变量转换为数值型变量 实例化模型并泰坦尼克号数据分析
这是一个很经典的案例,很多博主都写过,对,就是它:泰坦尼克号生存率的分析,它是kaggle上的一道题,通过船上乘客的信息分析和建模,预测哪些乘客得以生还。我们就非常粗暴地拿这个数据集做一个简单的分析好了。使用工具:Excel(对,就是这么简单粗暴)数据源的获取可后台回复:泰坦尼克一、明确目的191机器学习实战2:KNN决策树探究泰坦尼克号幸存者问题
KNN决策树解决泰坦尼克 import pandas as pd from sklearn.tree import DecisionTreeClassifier, export_graphviz from sklearn.metrics import classification_report import graphviz #决策树可视化 data = pd.read_csv(r"titanic_data.csv") data.drop("PassengerI1,514人罹难,泰坦尼克号沉船事故背后的数据统计如何?
泰坦尼克号是一艘英国皇家邮轮,在其服役时间是全世界最大的海上船舶,号称“永不沉没”、“梦幻之船”。其头等舱在设计上追求舒适和奢华的最高水准,设有健身房、游泳池、接待室、高档餐厅和豪华客舱。然而,1912年4月10日,泰坦尼克号首航竟成为最后一次载客出航。4月15日在中途发生数据分析之KAGGLE-泰坦尼克号人员生存预测问题
本文参考 handsye https://blog.csdn.net/handsye/article/details/83999641 对部分内容进行了修正和整理 数据分析之KAGGLE-泰坦尼克号人员生存预测问题 分析目的 完成对什么样的人可能生存的分析。 # 导入相关数据包 import numpy as np import pandas as pd import seaborn as泰坦尼克号生存预测分析
此文发表在简书,复制过来,在下方放上链接。 https://www.jianshu.com/p/a09b4dc904c9 泰坦尼克号生存预测 1.背景与挖掘目标 “泰坦尼克号”的沉没是历史上最臭名昭著的海难之一。1912年4月15日,泰坦尼克号在处女航中与冰山相撞后沉没,2224名乘客和机组人员中有1502人死亡。这场耸人听kaggle 泰坦尼克号 (预测人员是否存活)
通过学习其他人的代码,了解整个预测过程,以下代码为他人代码。 登录kaggle中找到titantic 下载所用数据。如下: gender_submission是最终提交形式,只包含两列:人员编号、是否存活 test为测试数据,train为训练数据 使用jupyter notebook进行作业 首先导入所需要的基本库,(并非所有,后面Keras的泰坦尼克号的生存率的数据分析
1 # coding: utf-8 2 3 # # 1. Import Library 4 5 # In[1]: 6 7 8 import numpy 9 import pandas as pd 10 from sklearn import preprocessing 11 numpy.random.seed(10) 12 13 14 # # 数据准备 15 16 # In[2]: 17 18 19 all_df = pd.read_excel("data/