seaborn可视化详解
作者:互联网
引言
当我们快速理解数据内容及其分布时,可以选用一些可视化工具,将数据展示出来,从而使我们对数据具有一个直观的认识。常用的数据可视化库有
- matplotlib
- Seaborn
其中Seaborn可以认为是matplotlib的扩展,从而使得表达更丰富,数据表达更直观
示例
首先导入Seaborn库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline %表示画的图形在notebook中显示出来
sns.set() %使用seaborn风格画图
本文中的使用到的数据为seaborn中自带的数据集tips
本次使用到的数据集是比较有名的tips(小费)数据集。小费数据集,是一个餐厅侍者收集的关于小费的数据,其中包含了七个变量,包括总费用、付小费的金额、付款者性别、是否吸烟、日期、日间、顾客人数。
- 条形图绘制
标准格式为
sns.distplot(data[“variablename”])
我们看一下总账单分布
sns.distplot(tips["total_bill"], bins=16, color="purple")
tips[“total_bill”]指定绘画某一列的数据
bins=16表示柱状图的个数
- 联合分布
sns.jointplot(x="total_bill", y="tip", data=tips, color="purple")
还可以通过修改kind参数,显示kde曲线等
解释上图中,颜色越深代表其密度越大
- 矩阵图
sns.pairplot(tips, hue="sex", palette="Set2")
- 箱体图
箱体图,即箱线图,从下到上五条线分别表示最小值、下四分位数、中位数、上四分位数和最大值。
箱线图作为描述统计的工具之一,其功能有独特之处,主要有以下几点:
1.直观明了地识别数据批中的异常值
2.利用箱线图判断数据批的偏态和尾重
3.利用箱线图比较几批数据的形状
sns.boxplot(x="day", y="total_bill", data=tips)
- 小提琴图
sns.violinplot(x="day", y="total_bill", data=tips)
扩展-风格管理 - 绘图风格设置
Seaborn 将 matplotlib 的参数划分为两个独立的组合。第一组是设置绘图的外观风格的,第二组主要将绘图的各种元素按比例缩放的,以至可以嵌入到不同的背景环境中。
操控这些参数的接口主要有两对方法:
控制风格:axes_style(), set_style()
缩放绘图:plotting_context(), set_context()
有五种seaborn的风格,它们分别是:darkgrid, whitegrid, dark, white, ticks。它们各自适合不同的应用和个人喜好。默认的主题是darkgrid。
例如
sns.set_style("whitegrid")
sns.distplot(tips["total_bill"], bins=16, color="purple")
移除轴脊柱
sns.distplot(tips["total_bill"], bins=16, color="purple")
sns.despine()
当刻度没有完全覆盖整个轴的范围时,trim参数可以用来限制已有脊柱的范围。
sns.distplot(tips["total_bill"], bins=16, color="purple")
sns.despine(offset=10, trim=True)
自定义风格
将一个字典参数传递给axes_style()和set_style()的参数rc。而且你只能通过这个方法来覆盖风格定义中的部分参数。
绘图元素比例
有四个预置的环境,按大小从小到大排列分别为:paper, notebook, talk, poster。其中,notebook是默认的。
sns.set_context("poster")
sns.distplot(tips["total_bill"], bins=16, color="purple")
标签:set,seaborn,purple,bill,详解,可视化,sns,tips,total 来源: https://blog.csdn.net/u014675538/article/details/91465531