2020-11-25
作者:互联网
随机抽样
numpy.random 模块对 Python 内置的 random 进行了补充,增加了一些用于高效生成多种概率分布的样本值的函数,如正态分布、泊松分布等。
numpy.random.seed(seed=None)
Seed the generator.
seed()
用于指定随机数生成时所用算法开始的整数值,如果使用相同的seed()
值,则每次生成的随机数都相同,如果不设置这个值,则系统根据时间来自己选择这个值,此时每次生成的随机数因时间差异而不同。
在对数据进行预处理时,经常加入新的操作或改变处理策略,此时如果伴随着随机操作,最好还是指定唯一的随机种子,避免由于随机的差异对结果产生影响。
离散型随机变量
二项分布
二项分布可以用于只有一次实验只有两种结果,各结果对应的概率相等的多次实验的概率问题。比如处理猜10次拳赢6次的概率等类似的问题。
二项分布概率函数的代码表示:binom.pmf(k) = choose(n, k) p**k (1-p)**(n-k)
二项分布概率函数的数学表示:
numpy.random.binomial(n, p, size=None)
Draw samples from a binomial distribution.
表示对一个二项分布进行采样,size
表示采样的次数,n
表示做了n
重伯努利试验,p
表示成功的概率,函数的返回值表示n
中成功的次数。
泊松分布
泊松分布主要用于估计某个时间段某事件发生的概率。
泊松概率函数的代码表示:poisson.pmf(k) = exp(-lam) lam*k / k!
泊松概率函数的数学表示:
numpy.random.poisson(lam=1.0, size=None)
Draw samples from a Poisson distribution.
表示对一个泊松分布进行采样,size
表示采样的次数,lam
表示一个单位内发生事件的平均值,函数的返回值表示一个单位内事件发生的次数。
超几何分布
在超几何分布中,各次实验不是独立的,各次实验成功的概率也不等。 超几何分布概率函数的数学表示:
numpy.random.hypergeometric(ngood, nbad, nsample, size=None)
Draw samples from a Hypergeometric distribution.
表示对一个超几何分布进行采样,size
表示采样的次数,ngood
表示总体中具有成功标志的元素个数,nbad
表示总体中不具有成功标志的元素个数,ngood+nbad
表示总体样本容量,nsample
表示抽取元素的次数(小于或等于总体样本容量),函数的返回值表示抽取nsample
个元素中具有成功标识的元素个数。
最近忙,明天补习落下的知识
标签:11,25,泊松,random,概率函数,采样,2020,表示,size 来源: https://blog.csdn.net/weixin_45778504/article/details/110148135