其他分享
首页 > 其他分享> > matplotlib------箱线图

matplotlib------箱线图

作者:互联网

一、代码示例

import pandas as pd
import matplotlib.pyplot as plt

data = pd.read_csv('../../Data/exercise_data/train.csv')
any(data.Age.isnull())  # 检查年龄是否有缺失
data.dropna(subset=['Age'], inplace=True)  # 删除含有缺失年龄的数据

# 设置中文和负号正常显示
plt.rcParams['font.sans-serif'] = 'Microsoft YaHei'
plt.rcParams['axes.unicode_minus'] = False
# 设置图形的显示风格
plt.style.use('ggplot')

plt.boxplot(
    x=data.Age,  # 指定绘图数据
    patch_artist=True,  # 要求用自定义颜色填充盒形图,默认白色填充
    showmeans=True,  # 以点的形式显示均值
    boxprops={
        'color': 'black',
        'facecolor': '#9999ff'
    },  # 设置箱体属性,填充色和边框色
    flierprops={
        'marker': 'o',
        'markerfacecolor': 'red',
        'color': 'black'
    },  # 设置异常值属性,点的形状、填充色和边框色
    meanprops={
        'marker': 'D',
        'markerfacecolor': 'indianred'
    },  # 设置均值点的属性,点的形状、填充色
    medianprops={
        'linestyle': '--',
        'color': 'orange'
    })  # 设置中位数线的属性,线的类型和颜色

plt.ylim(0, 85)
# 去除箱线图的上边框与右边框的刻度标签
plt.tick_params(top='off', right='off')
plt.show()
# 按舱级排序
data.sort_values(by='Pclass', inplace=True)

# 通过for循环将不同仓位的年龄人群分别存储到列表Age变量中
Age = []
Levels = data.Pclass.unique()
for Pclass in Levels:
    Age.append(data.loc[data.Pclass == Pclass, 'Age'])

plt.boxplot(
    x=Age,
    patch_artist=True,
    labels=['一等舱', '二等舱', '三等舱'],  # 添加具体的标签名称
    showmeans=True,
    boxprops={
        'color': 'black',
        'facecolor': '#9999ff'
    },
    flierprops={
        'marker': 'o',
        'markerfacecolor': 'red',
        'color': 'black'
    },
    meanprops={
        'marker': 'D',
        'markerfacecolor': 'indianred'
    },
    medianprops={
        'linestyle': '--',
        'color': 'orange'
    })
plt.show()

二、效果图


三、图形分析

四、函数解析

五、数据集下载

点击查看代码
12

标签:线图,plt,color,True,Age,matplotlib,Pclass,------,data
来源: https://www.cnblogs.com/bite-an-orange/p/16473508.html