matplotlib------箱线图
作者:互联网
一、代码示例
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('../../Data/exercise_data/train.csv')
any(data.Age.isnull()) # 检查年龄是否有缺失
data.dropna(subset=['Age'], inplace=True) # 删除含有缺失年龄的数据
# 设置中文和负号正常显示
plt.rcParams['font.sans-serif'] = 'Microsoft YaHei'
plt.rcParams['axes.unicode_minus'] = False
# 设置图形的显示风格
plt.style.use('ggplot')
plt.boxplot(
x=data.Age, # 指定绘图数据
patch_artist=True, # 要求用自定义颜色填充盒形图,默认白色填充
showmeans=True, # 以点的形式显示均值
boxprops={
'color': 'black',
'facecolor': '#9999ff'
}, # 设置箱体属性,填充色和边框色
flierprops={
'marker': 'o',
'markerfacecolor': 'red',
'color': 'black'
}, # 设置异常值属性,点的形状、填充色和边框色
meanprops={
'marker': 'D',
'markerfacecolor': 'indianred'
}, # 设置均值点的属性,点的形状、填充色
medianprops={
'linestyle': '--',
'color': 'orange'
}) # 设置中位数线的属性,线的类型和颜色
plt.ylim(0, 85)
# 去除箱线图的上边框与右边框的刻度标签
plt.tick_params(top='off', right='off')
plt.show()
# 按舱级排序
data.sort_values(by='Pclass', inplace=True)
# 通过for循环将不同仓位的年龄人群分别存储到列表Age变量中
Age = []
Levels = data.Pclass.unique()
for Pclass in Levels:
Age.append(data.loc[data.Pclass == Pclass, 'Age'])
plt.boxplot(
x=Age,
patch_artist=True,
labels=['一等舱', '二等舱', '三等舱'], # 添加具体的标签名称
showmeans=True,
boxprops={
'color': 'black',
'facecolor': '#9999ff'
},
flierprops={
'marker': 'o',
'markerfacecolor': 'red',
'color': 'black'
},
meanprops={
'marker': 'D',
'markerfacecolor': 'indianred'
},
medianprops={
'linestyle': '--',
'color': 'orange'
})
plt.show()
二、效果图
三、图形分析
四、函数解析
五、数据集下载
点击查看代码
12
标签:线图,plt,color,True,Age,matplotlib,Pclass,------,data 来源: https://www.cnblogs.com/bite-an-orange/p/16473508.html