其他分享
首页 > 其他分享> > 分布式计算过程

分布式计算过程

作者:互联网

# 定义一个列表
list1 = [1,2,3,4,5,6,7,8,9,10]
# 将列表通过SparkContext将数据转换为一个分布式集合RDD
inputRdd = sc.parallelize(list1)
#如果有n个结点 那么数据就会分成n分 存在各个结点

# 将RDD中每个分区的数据进行处理
rsRdd = inputRdd.map(lambda x : x**2)

#会在n个机器上同时运行一个线程进行数据处理 即分布式计算

# 将结果RDD的每个元素进行输出
rsRdd.foreach(lambda x : print(x))

#输出结果顺序是个结点之间无序的 因为是谁先算完输出谁 

 

标签:结点,list1,分布式计算,inputRdd,RDD,rsRdd,过程
来源: https://www.cnblogs.com/q1231/p/16503643.html