其他分享
首页 > 其他分享> > 086-Spark-RDD-任务(task)划分

086-Spark-RDD-任务(task)划分

作者:互联网

RDD任务切分中间分为:Application、Job、Stage和Task
Application:初始化一个SparkContext即生成一个Application;
Job:一个Action算子就会生成一个Job;
Stage:Stage等于宽依赖(ShuffleDependency)的个数加1;
Task:一个Stage阶段中,最后一个RDD的分区个数就是Task的个数。
注意:Application->Job->Stage->Task每一层都是1对n的关系。

标签:Task,RDD,个数,086,Application,Job,task,Stage
来源: https://www.cnblogs.com/data-world/p/15778058.html