机器学习—决策树
作者:互联网
泰坦尼克号沉没是历史上最臭名昭着的沉船之⼀。 1912年4⽉ 15⽇ , 在她的处⼥航中, 泰坦尼克号在与冰⼭相撞后沉没, 在2224名乘客和机组⼈员中造成1502⼈死亡。 这场耸⼈听闻的悲剧震惊了国际社会, 并为船舶制定了更好的安全规定。 造成海难失事的原因之⼀是乘客和机组⼈员没有⾜够的救⽣艇。 尽管幸存下沉有⼀些运⽓因素, 但有些⼈⽐其他⼈更容易⽣存, 例如妇⼥, ⼉童和上流社会。 在这个案例中, 我们要求您完成对哪些⼈可能存活的分析。 特别是,我们要求您运⽤机器学习⼯具来预测哪些乘客幸免于悲剧。
1.泰坦尼克号生还预测
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import classification_report
data=pd.read_csv('titanic_data.csv')
print(data)
data.drop('PassengerId',axis=1,inplace=True) #删除PassengerId列
data.loc[data['Sex']=='male','Sex']=1
data.loc[data['Sex']=='female','Sex']=0 #用数值1来代替male 用数值0来代替female
data.fillna(data['Age'].mean(),inplace=True) #用均值来填充缺失值
Dtc=DecisionTreeClassifier(max_depth=5,random_state=8) #构建决策树模型
Dtc.fit(data.iloc[:,1:],data['Survived']) #模型训练
pre=Dtc.predict(data.iloc[:,1:]) #模型预测
pre==data['Survived'] #比较模型预测值与样本实际值是否一致
classification_report(data['Survived'],pre) #模型分类报告
print(classification_report(data['Survived'],pre) )
2.参考文章
【创作不易,望点赞收藏,若有疑问,请留言,谢谢】
标签:pre,泰坦尼克号,机器,Sex,学习,Survived,report,data,决策树 来源: https://www.cnblogs.com/dongxuelove/p/16434213.html