其他分享
首页 > 其他分享> > 大数据应用期末总评(hadoop综合大作业)

大数据应用期末总评(hadoop综合大作业)

作者:互联网

作业要求源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363

 

 

一、将爬虫大作业产生的csv文件上传到HDFS

   (1)

   (2)

   (3)

 

二、对CSV文件进行预处理生成无标题文本文件

   (1)

 

三、把hdfs中的文本文件最终导入到数据仓库Hive中

   (1)

  (2)

 

四、在Hive中查看并分析数据

   (1)查询所有省份

   (2)

  (3)

  (4)

  (5)

  (6)

   (7)

  (8)

  (9)

  (10)

 

五、总结

 

 

标签:导入到,文件,作业,hadoop,Hive,期末,无标题,文本文件,总评
来源: https://www.cnblogs.com/trojans/p/11024098.html