其他分享
首页 > 其他分享> > 大三寒假学习 spark学习 RDD的依赖关系和运行过程

大三寒假学习 spark学习 RDD的依赖关系和运行过程

作者:互联网

窄依赖与宽依赖的区别:

窄依赖:表现为一个父RDD的分区对应于一个子RDD的分区或多个父RDD的分区对应于一个子RDD的分区

宽依赖:表现为存在一个父RDD的一个分区对应一个子RDD的多个分区

Stage的划分:

   Spark通过分析各个RDD的依赖关系生成了DAG再通过分析各个RDD中的分区之间的依赖关系来决定如何划分Stage

根据RDD分区的依赖关系划分Stage:

  

 

Stage的划分:

 RDD运行过程:

RDD在Spark中的运行过程:

   

 

标签:依赖,分区,学习,RDD,划分,DAG,spark,Stage
来源: https://www.cnblogs.com/fengchuiguobanxia/p/15825918.html