其他分享
首页 > 其他分享> > 数理统计与数据分析-hw1

数理统计与数据分析-hw1

作者:互联网

 

5章-习题5.4

13

 

 

 

 

Matlab:

m=60

n=1000

r=binornd(1,0.5,m,n)-0.5

z=sum(r)*100

figure

histfit(z)

 

 

19.

a.

N=100:

n=100

x=rand(n,1)

f=cos(2*pi*x)

I=sum(f)/n

 

结果:

I =

 

   -0.0179

 

 

1000次对n=100的蒙特卡洛方法的结果的分布拟合:

n=100

x=rand(n,1000)

f=cos(2*pi*x)

I=sum(f)/n

figure

histfit(I)

 

 

 

 

N=1000:

 

I =

 

0.0109

 

1000次对n=1000的蒙特卡洛方法的结果的分布拟合:

 

 

 

 

通过以上两种n=100和n=1000的蒙特卡洛方法的多次试验可以知道两种都可以得到精确答案0的近似结果,但是无法完全得到精确答案,而且多次试验的曲线拟合是均值为0的某种正态分布,可以看出来n=1000比n=100得到的结果对精确答案的偏差更小,更集中。

b.

通过积分计算器可以得到

 

 

 

1000次蒙特卡洛方法得到的近似值是I = 0.2183

多次蒙特卡洛方法得到的分布拟合曲线是:

 

 

 

可以近似,但是依然无法得到精确值。

20.

 

 

 

19.a.中cos(2*pi*x)的方差经计算为1/2,则Var(I)的估计标准差为√(1/2000),约等于0.02236067977,n=100和n=1000的实际误差分别是0.0708,0.0201。所以蒙特卡洛采取的样本点越多实际的误差越接近与估计标准差。

n=1000

x=rand(n,100)

f=cos(2*pi*x)

I=sum(f)/n

s=std(I)

 

30.

a. Sn

 

 

 

b. Sn/n

 

 

 

c. Sn-n/2

 

 

 

d. (Sn-n/2)/n

 

 

 

e. (Sn-n/2)/n

 

 

 

其中,绘图采取生成100组的1000个0和1之间的均匀随机变量进行加和得到Sn并对其进行统计,拟合,得到不同的曲线。

Sn的曲线是以500为均值,方差为1000/12(标准差约为9.1)的正态曲线。

Sn/n的曲线是以0.5为均值,方差为1/12000(标准差约为0.009)的正态曲线。

Sn-n/2的曲线是以0为均值,方差为1000/12(标准差约为9.1)的正态曲线。

(Sn-n/2)/n的曲线是以0为均值,方差为1/12000(标准差约为0.009)的正态曲线。

(Sn-n/2)/√n的曲线是以0为均值,方差为1/12(标准差约为0.083)的正态曲线。

 

6章

 

1、生成t分布与F分布的随机数,并画图

T分布:

 

 

 

n=1000

N=10

u=randn(N,n)

z=randn(1,n)

chi2=sum(u.^2)

t=z./(sqrt(chi2/N))

histogram(t)

 

 

 

F分布:

 

n=1000

M=10

N=10

u=randn(M,n)

v=randn(N,n)

chi1=sum(u.^2)

chi2=sum(v.^2)

f=(chi1/M)./(chi2/N)

histogram(f)

 

2、复现图6.1

 

 

 

x=-3:0.01:3

t1=tpdf(x,5)

t2=tpdf(x,10)

t3=tpdf(x,30)

z=normpdf(x,0,1)

figure

plot(x,t1,'-.',x,t2,':',x,t3,'--',x,z,'-')

axis([-3,3,0,0.4])

legend('自由度为5','自由度为10','自由度为30','标准正态分布')

 

3、仿真验证习题6,7,8

习题6

 

 

 

n=1000

N=10

u=randn(N,n)

z=randn(1,n)

chi2=sum(u.^2)

t=z./(sqrt(chi2/N))

T=t.^2

histogram(T)

 

 

x=0:0.01:10

n=10

f=fpdf(x,1,n)

figure

plot(x,f,'--')

axis([-1,25,0,4])

legend('自由度为1,n的f分布')

 

 

习题7

x=-3:0.01:3

t1=tpdf(x,1)

c=1./(pi*(1+x.^2))

figure

subplot(2,2,1:2)

plot(x,t1,'-.')

axis([-3,3,0,0.4])

legend('自由度为1的t分布')

subplot(2,2,3:4)

plot(x,c,'-')

axis([-3,3,0,0.4])

legend('柯西分布')

 

 

习题8

不会写,随便画的。

 

 

 

clear all

a=0:0.01:10

x=exprnd(1,1,100)

y=exprnd(1,1,100)

z=x./y

f=fpdf(a,1,1)

 

figure

subplot(2,2,1:2)

histogram(z,100)

 

subplot(2,2,3:4)

plot(a,f,'-.')

axis([-0.5,10,0,4])

legend('自由度为1,1的f分布')

 

7章-用数据hospitals生成简单随机样本,复现7.3节:

图7.2

其中一个代码:

N=393%医院总数为393

n=8%一次抽样抽n个

M=500%做500次重复独立实验

data=[]%定义空矩阵装数据

for i=1:M%for循环

    index1=randperm(numel(hospitals)/2);%打乱行顺序

    data=[data mean(hospitals(index1(1:n),:).discharges)];%N个数据中随机抽取n个数据

end

figure

histogram(data)%画图

 

 

A.n=8

 

 

 

B.n=16

 

 

 

C.n=32

 

 

 

D.n=64

 

 

 

例7.3.1.2-3

7.3.1.2

抽样的样本均值的方差为:

s =

 

   99.5562

代码:

N=393%医院总数为393

n=8%一次抽样抽n个

M=500%做500次重复独立实验

data=[]%定义空矩阵装数据

for i=1:M%for循环

    index1=randperm(numel(hospitals)/2);%打乱行顺序

    data=[data mean(hospitals(index1(1:n),:).discharges)];%N个数据中随机抽取n个数据

end

v=var(data)

s=sqrt(v)

 

 

总体样本的标准差为:

s =

 

  589.7173

代码:

v=var(hospitals.discharges)

s=sqrt(v)

 

符合例7.3.1.2所描述

 

 

7.3.1.3

总体样本的比例为:

p =

 

    0.6539

代码:

p=sum(hospitals.discharges<1000)/N

 

样本的比例的方差为:

s =

 

0.0817

代码:

N=393%医院总数为393

n=32%一次抽样抽n个

M=500%做500次重复独立实验

data=[]%定义空矩阵装数据

for i=1:M%for循环

    index1=randperm(numel(hospitals)/2);%打乱行顺序

    data=[data  sum(hospitals(randi(N,1,n),:).discharges<1000)/n];%N个数据中随机抽取n个数据

end

s=std(data)

 

 

 

例7.3.2.1-3

7.3.2.1

容量为50的简单随机样本的方差和标准差分别是:

v =

 

   7.7610e+03

 

 

s =

 

   88.0967

代码:

 

N=393%医院总数为393

n=50%一次抽样抽n个

M=500%做500次重复独立实验

data=[]%定义空矩阵装数据

for i=1:M%for循环

    index1=randperm(numel(hospitals)/2);%打乱行顺序

    data=[data mean(hospitals(randi(N,1,n),:).discharges)];%N个数据中随机抽取n个数据

end

v=var(data)

s=sqrt(v)

 

 

7.3.2.2

总人数估计的标准差为:

s =

 

   4.2676e+03

代码:

N=393%医院总数为393

n=50%一次抽样抽n个

M=500%做500次重复独立实验

data=[]%定义空矩阵装数据

for i=1:M%for循环

    index1=randperm(numel(hospitals)/2);%打乱行顺序

    data=[data sum(hospitals(randi(N,1,n),:).discharges)];%N个数据中随机抽取n个数据

end

v=var(data)

s=sqrt(v)

 

 

7.3.2.3

出院人数少于1000的医院比例的p的标准差为:

s =

 

0.0687

代码:

N=393%医院总数为393

n=50%一次抽样抽n个

M=500%做500次重复独立实验

data=[]%定义空矩阵装数据

for i=1:M%for循环

    index1=randperm(numel(hospitals)/2);%打乱行顺序

    data=[data sum(hospitals(randi(N,1,n),:).discharges<1000)/n];%N个数据中随机抽取n个数据

end

v=var(data)

s=sqrt(v)

 

标签:数据分析,data,sum,数理统计,Sn,100,hw1,hospitals,1000
来源: https://www.cnblogs.com/linear345/p/15339811.html