1、去重
(1)distinct 为无参,是所有字段的去重
(2)dropDuplicates含参数,可以指定列名为参数去重
2、columns算子
返回一个String类型的数组,返回值是列的名字集合
3、when算子
.withColumn("name", when(col("name").isNull, lit("否")).otherwise(lit("是")))
标签:name,when,lit,dropDuplicates,参数,算子
来源: https://www.cnblogs.com/renyang/p/16487719.html