MATLAB 数据分析一: 描述样本数据的几个基本特征
作者:互联网
测试数据:
load yhdz.mat
yhdz如下:
yhdz = 3 4 5 6 7 7 89 8 90 11 22 3 45 77 66 88 87 44 2 23
1,均值:
mean(yhdz)
ans = 34.3500
2,中位数:排序后中间数据的值,若数据量为奇数,则为中间的数值;若数据量为偶数个,中位数为中间两个数的平均值。
median(yhdz)
ans = 16.5000
3,分位数:设0<= p < 1,则样本数据有p分位数的概念。事实上,p=0.5时,0.5分位数就是中位数,由此,可以推出分位数的概念。常见的分位数有 0.25分位数、0.5分位数(即中位数)、0.75分位数。其中 0.75分位数和 0.25分位数又分别称为 上、下四分位数, 呵呵,
上分位数(即 0.75分位数 ):
prctile(yhdz,75)
ans = 71.5000
下分位数(即0.25分位数):
prctile(yhdz,25)
ans = 5.5000
4,三均值:三均值是上四分位数、中位数和下四分位数的加权平均,权向量为(0.25, 0.5, 0.25).
w=[0.25,0.5,0.25];
sanjunzhi = w * prctile(yhdz, [25,50,75])'
sanjunzhi = 27.5000
5,方差与标准差:
方差:方差是描述数据取值分散性的一种度量,它是数据相对于均值的差值平方的平均。
var(yhdz)
ans = 1.2303e+03
标准差:方差的算术平方根。
std(yhdz)
ans = 35.0763
6,极差与四分位极差:
极差:样本最大值与最小值的差。
range(yhdz)
ans = 88
四分位极差:样本上、下四分位数极差。
iqr(yhdz)
ans = 66
标签:数据分析,0.25,四分,极差,位数,ans,基本特征,yhdz,MATLAB 来源: https://blog.csdn.net/marraybug/article/details/118498429