titanic

首页 > TAG信息列表 > titanic

我的第一个 BigQuery ML 模型

我的第一个 BigQuery ML 模型 ○ 大查询是一个高度可扩展、无服务器、多云的数据仓库工具。反过来， BigQuery 机器学习 (BQML) 是一项功能，可让您使用标准 SQL 查询在 BigQuery 中构建和运行机器学习模型。借助 BQML，机器学习允许 SQL 专业人员使用现有的 SQL 技能和工具构建模型。

pandas快速入门

安装 pip3 install pandas pandas快速入门 1 pandas擅长处理哪些数据在处理表格数据时，例如存储在电子表格或数据库中的数据，pandas是适合您的工具。pandas将帮助您探索、清理和处理数据。在pandas中，数据表称为DataFrame。要加载pandas包并开始使用它，请导入该包。社区一致使用的p

考研进度记录表（复试准备阶段）

日期编程项目文献12.31《Python编程–从入门到实践》第1章起步第2章变量和简单数据类型第3章列表简介1.1《Python编程–从入门到实践》第4章操作列表第5章 if语句Kaggle–Titanic Tutorial1.2Kaggle – Titanic Advanced Feature Engineering Tutorial

python基础-Pandas数据处理

python基础-Pandas数据处理 pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现，它是使Python成

Python3数据分析处理库pandas

用pandas封装函数对数据进行读取，预处理，数据分析等操作。 pandas库是基于numpy库编写的，在命令行窗口安装完numpy后，安装pandas：pip install pandas。相关numpy库的内容参考 http://blog.csdn.net/cymy001/article/details/78163468 通常需要pandas读取的数据文件的文本格式为.txt

Titanic数据分析与可视化

同步转载至个人公众号：R语言学习同步转载至个人知乎专栏：R语言可视化进阶泰坦尼克沉船事故已经过去多年，但是关于它的生存预测问题一直是数据分析与建模的经典案例，今天抽空把Chuck Talbert大师做的预测进行简单翻译和再现，并加入个人理解，原文链接： [ Titanic: A TidyCaret Approach -

titanic乘客简单的数据分析

数据来源： kaggle的Titanic 生存模型：titanic_train.csv。引入的库： import numpy as np import pandas as pd import sys reload(sys) sys.setdefaultencoding('gbk') import matplotlib.pyplot as plt import seaborn as sns [/code] ## 数据分析：

R语言逻辑回归分析连续变量和分类变量之间的“相关性“

原文链接：http://tecdat.cn/?p=18169 比如说分类变量为是否幸存、是因变量，连续变量为年龄、是自变量，这两者可以做相关分析吗？两者又是否可以做回归分析？我们考虑泰坦尼克号数据集， titanic = titanic[!is.na(titanic$Age),] attach(titanic) 考虑两个变量，年龄x（连续变量）和幸

菜鸟笔记——决策树（Titanic）

from sklearn.model_selection import train_test_split import pandas as pd from sklearn.feature_extraction import DictVectorizer from sklearn.tree import DecisionTreeClassifier,export_graphviz def decision_tree(): #获取数据 data = pd.read_csv("http

机器学习（1）——从TItanic开始

机器学习（1）——从TItanic开始 Kaggle-TitanicStep1-环境配置Step2-数据概览Step3-数据统计与预处理3.1 数据统计代码与结果分析3.2 数据处理 Step4-线性回归分析Step5-Logistic回归分析Step6-随机森林预测Step7-生成新数据&数据关联性判断7.1 头衔('Title')的影响7.2 名字长

编程题：Titanic（地球上两地距离）

It is a historical fact that during the legendary voyage of “Titanic” the wireless telegraph machine had delivered 6 warnings about the danger of icebergs. Each of the telegraph messages described the point where an iceberg had been noticed. The first

入坑kaggle第四天- Titanic - Machine Learning from Disaster模型优化(进阶10%)

由于昨天毫无目标的调整参数，很快用完了kaggle的十次提交机会。以后，需要有目标的提交，防止浪费提交次数。 1 如何观察数据 1.1 通过四个方法, 观察数据 method 1: import pandas as pd df = pd.read_csv('titanic/train.csv') method 2: df.shape (891, 12) method 3: d

入坑kaggle第二天- 详细分析Titanic - Machine Learning from Disaster

kaggle创始人为Anthony毕业于墨尔本大学，于2010年在创立kaggle, 现在被google收购，现在有100多万活跃用户。学习kaggle平台如何参加比赛，如何提交项目练习Titanic - Machine Learning from Disaster 泰坦尼克号项目主要是通过一个train.csv文件提供的基础数据，预测test.csv文

1,514人罹难，泰坦尼克号沉船事故背后的数据统计如何？

泰坦尼克号是一艘英国皇家邮轮，在其服役时间是全世界最大的海上船舶，号称“永不沉没”、“梦幻之船”。其头等舱在设计上追求舒适和奢华的最高水准，设有健身房、游泳池、接待室、高档餐厅和豪华客舱。然而，1912年4月10日，泰坦尼克号首航竟成为最后一次载客出航。4月15日在中途发生

数据分析模型之决策树及随机森林

决策树信息熵熵原本是物理学中的⼀个定义，后来⾹农将其引申到了信息论领域，⽤来表示信息量的⼤⼩。信息量越⼤（分类越不“纯净”），对应的熵值就越⼤，反之亦然。条件熵条件熵 H(X|Y) 表示在已知随机变量Y的条件下，随机变量 X 的不确定性。信息增益信息增益率决策树中的ID3算法使

Kaggle——Titanic预测

下载数据集到本地分析数据先知晓各个数据特征的含义，观察一下找到有用的，也就是可以影响到预测标签的数据没有用的数据不用管处理数据这些有用的数据中，有些可能是空值如果该列数据较多，就取平均值如果极少，可以删了该行数据有些有用的数据是字符串，不是数值，需要转

pandas 如何选择的子集DataFrame

import pandas as pd titanic = pd.read_csv("data/titanic.csv") #pandas 中的Series属性包含(行,列) titanic.head() #head() 默认只显示5条 #结果: PassengerId Survived Pclass Name Sex ... Parch

pandas常用语法

常见的一些pandas的使用方法 import pandas as pd food_info = pd.read_csv('food_info.csv') print(type(food_info)) print(food_info.dtypes) # print(help(pd.read_csv)) # 显示前3行 food_info.head(3) print(food_info.head()) first_rows = food_info.head() print(first

决策树与随机森林实例

想必很多人都听说过决策树和随机森林，这是用来预测的数学模型，用python可以快速实现。下面这些代码请收好，理解其中的含义以后，改改参数你也可以用这个模型进行预测啦。不过博主以为，模型最后的寻找重要因子才是最有意思的部分～拿到数据集的第一步，清洗数据： import pandas as pd import n

使用 ID3 对 Titanic 进行决策树分类

原创转载请注明出处：https://www.cnblogs.com/agilestyle/p/12722688.html 过程划分数据加载 import graphviz import numpy as np import pandas as pd from sklearn import tree from sklearn.feature_extraction import DictVectorizer from sklearn.model_selection i

我的第一个 Kaggle 比赛学习 - Titanic

背景 Titanic: Machine Learning from Disaster - Kaggle 2 年前就被推荐照着这个比赛做一下，结果我打开这个页面便蒙了，完全不知道该如何下手。两年后，再次打开这个页面，看到清清楚楚的Titanic Tutorial - Kaggle，完全傻瓜式的照着做就能做下来。当年是什么蒙蔽了我的眼睛~ Target us

关于TiTanic存活预测实战(三、建模预测)

一、前言　　今年的春节有点不同啊，肺炎挺严重的，祈福武汉，祈福全国能尽快的战胜这次的疾病，也祝愿大家身体健康，阖家欢乐，也祈福大家在新的一年里，找工作的能找份好工作，找对象的能如愿找到合适的对象。同时也祝福我自己，嘻嘻。　　看到昨天和今天早上写的竟然还有人看，大年二十九和大年

关于TiTanic存活预测实战(二、数据清洗)

一、前言　　上一节已经对这次的实战北京做了介绍，这一节主要介绍数据清洗。　　唯一的就是，今天大年三十，祝大家新年快乐，来年事业、家庭都能如意！！！二、实战-数据清洗　　导入库 #导入库import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inli

kaggle初探之titanic

环境部署环境部署需要安装python，这里已经配置好,略过首先登陆kaggle 下载titanic数据 https://www.kaggle.com/c/titanic/data 点击Download ALL 查看数据 gender test.csv train.csv 开始建模 import pandas as pdimport osfrom sklearn.feature_extraction import D