其他分享
首页 > 其他分享> > Pig简介

Pig简介

作者:互联网

原文链接:http://www.cnblogs.com/devtao/p/3379720.html

What is Pig?

Pig 是一种探索大规模数据集的脚本语言,为了填补MapReduce开发周期长的缺点而产生。Pig是为批处理而设计的。如果只想查询一个大数据集中的一小部分数据,Pig的实现不会很好,因为它要扫描整个数据集或其中很大一部分。

Pig包括两部分:描述数据流的语言,Pig Latin;运行Pig Latin的执行环境。

安装与运行Pig

下载:http://apache.fayea.com/apache-mirror/pig/pig-0.12.0/,下载当前最新版本。

解压:tar -xvf pig-0.12.0.tar.gz

移动:mv pig-0.12.0 /opt/

设置环境变量:

sudo vim /etc/profile 

末尾添加:

export PIG_INSTALL=/opt/pig-0.12.0
export PATH=$PATH:$PIG_INSTALL/bin
export PIG_CLASSPATH=/opt/hadoop-1.2.1/conf

重新载入profile:

source /etc/profile

检测是否安装成功:

pig -help

转载于:https://www.cnblogs.com/devtao/p/3379720.html

标签:opt,Pig,简介,PIG,0.12,pig,com
来源: https://blog.csdn.net/weixin_30872867/article/details/98235810