其他分享
首页 > 其他分享> > pyspark 数据类型及转换

pyspark 数据类型及转换

作者:互联网

 

spark 有哪些数据类型 https://spark.apache.org/docs/latest/sql-reference.html

 

Spark 数据类型

Data Types

Spark SQL and DataFrames support the following data types:

对应的pyspark 数据类型在这里 pyspark.sql.types

 

一些常见的转化场景:

1. Converts a date/timestamp/string to a value of string, 转成的string 的格式用第二个参数指定

df.withColumn('test', F.date_format(col('Last_Update'),"yyyy/MM/dd")).show()

 

 

 

2. 转成 string后,可以 cast 成你想要的类型,比如下面的 date 型

df = df.withColumn('date', F.date_format(col('Last_Update'),"yyyy-MM-dd").alias('ts').cast("date"))

 

 

 

 

3. 把 timestamp 秒数(从1970年开始)转成日期格式 string

 

 

 

Ref:

https://stackoverflow.com/questions/54337991/pyspark-from-unixtime-unix-timestamp-does-not-convert-to-timestamp

标签:Represents,转换,string,pyspark,数据类型,values,numbers,byte,type
来源: https://www.cnblogs.com/mashuai-191/p/12580628.html