其他分享
首页 > 其他分享> > 07 从RDD创建DateFrame

07 从RDD创建DateFrame

作者:互联网

1.pandas df 与 spark df的相互转换

df_s=spark.createDataFrame(df_p)

df_p=df_s.toPandas()

 

 

 

2. Spark与Pandas中DataFrame对比

http://www.lining0806.com/spark%E4%B8%8Epandas%E4%B8%ADdataframe%E5%AF%B9%E6%AF%94/

 

3.1 利用反射机制推断RDD模式

3.2 使用编程方式定义RDD模式

4. DataFrame保存为文件

df.write.json(dir)

预练习:

读 学生课程分数文件chapter4-data01.txt,创建DataFrame。并尝试用DataFrame的操作完成实验三的数据分析要求。

 

count (DISTINCT course):课程总数

标签:07,df,创建,createDataFrame,DataFrame,RDD,DateFrame,spark
来源: https://www.cnblogs.com/lyx092/p/14766572.html