其他分享
首页 > 其他分享> > 山东大学软件工程应用与实践PIG小组代码综述

山东大学软件工程应用与实践PIG小组代码综述

作者:互联网

2021SC@SDUSC

目录

一、项目概述

Pig是Apache项目的一个子项目,Pig提供了一个支持大规模数据分析的平台。Pig包括用来描述数据分析程序的高级程序语言,以及对这些程序进行评估的基础结构。Pig突出的特点就是它的结构经得起大量并行任务的检验,这使得它能够处理大规模数据集。

目前Pig的基础结构层包括一个产生MapReduce程序的编译器。Pig的语言层包括一个叫做PigLatin的文本语言,它具有以下几个特征:

二、项目准备

#set pig environment
export PIG_HOME=/usr/local/pig
export PATH=$PATH:$PIG_HOME/bin

重新加载文件,使配置生效输入命令:
source /etc/profile

fs.default.name=hdfs://192.168.1.100:9000
mapred.job.tracker=192.168.1.100:9001

三、组内分工

标签:解析器,逻辑,优化,pig,软件工程,PIG,Pig,山东大学
来源: https://blog.csdn.net/qq_45822693/article/details/120557079