其他分享
首页 > 其他分享> > 学习笔记 — Datawhale数据分析入门Task04

学习笔记 — Datawhale数据分析入门Task04

作者:互联网

五、数据可视化

1、【思考】最基本的可视化图案有哪些?分别适用于那些场景?

可视化的场景可以分为五大类:展示趋势变化、展示分布关系、展示相关关系、展示排序信息、展示组成关系。

柱状图

反映一个类别变量和一个数值变量之间的关系
散点图反映数值型变量之间的相关性
折线图反映数据随时间变化的趋势
饼图反映数据的部分的占比情况
直方图只接收数值类型的变量数据,反映数据的分布情况

【matplotlib可视化】场景案例汇总_rightgoon的博客-CSDN博客

2、实例练习

2.1、导入库与数据

 2.2、可视化展示泰坦尼克号数据集中男女中生存人数分布情况(用柱状图试试)。

用GruopBy按性别分组再用sum统计

 

 2.3、可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图

 因为groupby函数可以接受多个key,但是这些key必须放在列表里面。

 

 合并

 2.4、可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况。(用折线图试试)(横轴是不同票价,纵轴是存活人数)

 

 2.5、可视化展示泰坦尼克号数据集中不同仓位等级的人生存和死亡人员的分布情况。

 

至此,女性幸存人数多,存活率高;低票价的死亡人数多,死亡率高;可以看出一等舱存活率最高,三等舱死亡人数最多。

 2.6、可视化展示泰坦尼克号数据集中不同年龄的人生存与死亡人数分布情况

直方图

 

 2.7、可视化展示泰坦尼克号数据集中不同仓位等级的人年龄分布情况。

 

 

标签:数据分析,泰坦尼克号,展示,人数,Datawhale,死亡,可视化,数据,Task04
来源: https://blog.csdn.net/weixin_47754374/article/details/122543672