爬虫 (四十二) 常用标准库 random (三十三)
作者:互联网
random模块用于生成伪随机数。
真正意义上的随机数(或者随机事件)是按照实验过程中表现的分布概率随机产生的,其结果是不可预测的。而计算机中的随机数是所谓的随机函数按照一定算法模拟产生的,其结果是确定的,是可预测的。所以用计算机随机函数所产生的“随机数”并不随机,是伪随机数,绝对不可以用来生成密码。
1.计算机的伪随机数是由随机种子根据一定的计算方法计算出来的数值。所以,只要计算方法一定,随机种子一定,那么产生的随机数就是固定的。
2.如果用户不设置随机种子,那么随机种子默认来自系统时钟。
1. 基本方法
random.seed(a=None, version=2)
初始化随机数生成器。如果未提供a或者a=None
,则使用系统时间为种子。如果a是一个整数,则作为新的种子。
random.getstate()
返回当前生成器的内部状态
random.setstate(state)
传入一个先前利用getstate方法获得的状态对象,使得生成器恢复到这个状态。
random.getrandbits(k)
返回一个不大于K位的Python整数(十进制),比如k=10,则结果是0~2^10之间的整数。
2. 针对整数的方法
注意:在使用后面的方法时,一定要小心区间的开闭!
random.randrange(stop)
random.randrange(start, stop[, step])
等同于后面的choice(range(start,stop,step))
,从range的范围内随机选择一个整数。这个方法并不实际创建range对象。
random.randint(a, b)
返回一个a <= N <= b
的随机整数N。等同于randrange(a, b+1)
。
3. 针对序列类型的方法
random.choice(seq)
从非空序列seq中随机选取一个元素。如果seq为空则弹出IndexError
异常。
random.choices(population, weights=None, *, cum_weights=None, k=1)
3.6版本新增。从population
集群中随机抽取K个元素。weights
是相对权重列表,cum_weights
是累计权重,两个参数不能同时存在。
random.shuffle(x[, random])
随机打乱序列x内元素的排列顺序,俗称“洗牌”。只能用于可变的序列,对于不可变序列,请使用下面的sample()
方法。
random.sample(population, k)
从population样本或集合中随机抽取K个不重复的元素形成新的序列。常用于不重复的随机抽样。返回的是一个新的序列,不会破坏原有序列。比如从一个整数区间随机抽取一定数量的整数random.sample(range(10000000), k=60)
,这非常有效和节省空间。如果k大于population的长度,则弹出ValueError异常。
4. 真值分布
random模块最高端的功能其实在这里。
random.random()
返回一个介于左闭右开[0.0, 1.0)
区间的浮点数。
random.uniform(a, b)
返回一个介于a和b之间的浮点数。如果a>b,则是b到a之间的浮点数。这里的a和b都有可能出现在结果中。
random.triangular(low, high, mode)
返回一个low <= N <=high
的三角形分布的随机数。参数mode指明众数出现位置。
random.betavariate(alpha, beta)
β分布。返回的结果在0~1之间。
random.expovariate(lambd)
指数分布
random.gammavariate(alpha, beta)
伽马分布
random.gauss(mu, sigma)
高斯分布
random.lognormvariate(mu, sigma)
对数正态分布
random.normalvariate(mu, sigma)
正态分布
random.vonmisesvariate(mu, kappa)
卡帕分布
random.paretovariate(alpha)
帕累托分布
random.weibullvariate(alpha, beta)
这个...请数学高手解答一下,囧。
5. 可选择的生成器
class random.SystemRandom([seed])
使用os.urandom()
方法生成随机数的类,由操作系统提供源码,不一定所有系统都支持。
6. 重要的例子
>>> from random import *
>>> random() # 随机浮点数: 0.0 <= x < 1.0
0.37444887175646646
>>> uniform(2.5, 10.0) # 随机浮点数: 2.5 <= x < 10.0
3.1800146073117523
>>> randrange(10) # 0-9的整数:
7
>>> randrange(0, 101, 2) # 0-100的偶数
26
>>> choice(['win', 'lose', 'draw']) # 从序列随机选择一个元素
'draw'
>>> deck = 'ace two three four'.split()
>>> shuffle(deck) # 对序列进行洗牌,改变原序列
>>> deck
['four', 'two', 'ace', 'three']
>>> sample([10, 20, 30, 40, 50], k=4) # 不改变原序列的抽取指定数目样本,并生成新序列
[40, 10, 50, 30]
>>> # 6次旋转红黑绿轮盘(带权重可重复的取样),不破坏原序列
>>> choices(['red', 'black', 'green'], [18, 18, 2], k=6)
['red', 'green', 'black', 'black', 'red', 'black']
>>> # Deal 20 cards without replacement from a deck of 52 playing cards
>>> # and determine the proportion of cards with a ten-value
>>> # (a ten, jack, queen, or king).
>>> deck = collections.Counter(tens=16, low_cards=36)
>>> seen = sample(list(deck.elements()), k=20)
>>> seen.count('tens') / 20
0.15
>>> # Estimate the probability of getting 5 or more heads from 7 spins
>>> # of a biased coin that settles on heads 60% of the time.
>>> trial = lambda: choices('HT', cum_weights=(0.60, 1.00), k=7).count('H') >= 5
>>> sum(trial() for i in range(10000)) / 10000
0.4169
>>> # Probability of the median of 5 samples being in middle two quartiles
>>> trial = lambda : 2500 <= sorted(choices(range(10000), k=5))[2] < 7500
>>> sum(trial() for i in range(10000)) / 10000
0.7958
下面是生成一个包含大写字母A-Z和数字0-9的随机4位验证码的程序
import random
checkcode = ''
for i in range(4):
current = random.randrange(0,4)
if current != i:
temp = chr(random.randint(65,90))
else:
temp = random.randint(0,9)
checkcode += str(temp)
print(checkcode)
下面是生成指定长度字母数字随机序列的代码:
import random, string
def gen_random_string(length):
# 数字的个数随机产生
num_of_numeric = random.randint(1,length-1)
# 剩下的都是字母
num_of_letter = length - num_of_numeric
# 随机生成数字
numerics = [random.choice(string.digits) for i in range(num_of_numeric)]
# 随机生成字母
letters = [random.choice(string.ascii_letters) for i in range(num_of_letter)]
# 结合两者
all_chars = numerics + letters
# 洗牌
random.shuffle(all_chars)
# 生成最终字符串
result = ''.join([i for i in all_chars])
return result
if __name__ == '__main__':
print(gen_random_string(64))
标签:三十三,randrange,random,爬虫,range,随机,随机数,序列 来源: https://blog.51cto.com/u_13721123/2993845