其他分享
首页 > 其他分享> > 算子

算子

作者:互联网

1、去重

(1)distinct 为无参,是所有字段的去重

(2)dropDuplicates含参数,可以指定列名为参数去重

 

2、columns算子

返回一个String类型的数组,返回值是列的名字集合

 

3、when算子

.withColumn("name", when(col("name").isNull, lit("否")).otherwise(lit("是")))
 

标签:name,when,lit,dropDuplicates,参数,算子
来源: https://www.cnblogs.com/renyang/p/16487719.html