首页 > 其他分享> > Spark分区 Spark分区 2022-01-24 23:34:52 作者:互联网 默认采用的是Hash分区 缺点:可能导致每个分区中数据量的不均匀,极端情况下会导致某些分区拥有RDD的全部数据 Ranger分区 要求RDD中的KEY类型必须可以排序 自定义分区 根据需求,自定义分区 标签:Hash,自定义,Ranger,分区,RDD,数据量,Spark 来源: https://www.cnblogs.com/zhbeii/p/15841353.html