其他分享
首页 > 其他分享> > 6. RDD综合练习:更丰富的操作

6. RDD综合练习:更丰富的操作

作者:互联网

一、集合运算练习

union()
image
intersection()
image
subtract()
image
cartesian()
image

二、内连接与外连接

join()
image
leftOuterJoin()
image
rightOuterJoin()
image
fullOuterJoin()
image

三、综合练习:学生课程分数

网盘下载sc.txt文件,通过RDD操作实现以下数据分析:

image

image

image

image

image

image

image

image

image

image

image

image
image

image

image

image

image

image

image

image

reduceByKey 用于对每个 key 对应的多个 value 进行 merge 操作,最重要的是它能够在本地先进行 merge 操作,并且 merge 操作可以通过函数自定义;

combineByKey是一个比较底层的算子
1.createCombiner():在遍历过程中,遇到新的键,就会调用createCombiner()函数。这个过程会发生在每一个分区内,因为RDD中有不同的分区,也就有同一个键调用多次createCombiner的情况。
2.mergeValue() 遇到已经重复的键,调用mergeValue()函数。
3.mergeCombiners() 如果有2个或者更多的分区,会把分区的结果合并。
4.pationer 分区函数()

标签:Tom,map,分数,每门,练习,RDD,选修,操作
来源: https://www.cnblogs.com/orenoxuan/p/16168144.html