其他分享
首页 > 其他分享> > Impala官网翻译01-介绍Apache Impala

Impala官网翻译01-介绍Apache Impala

作者:互联网

介绍Apache Impala

Impala直接对存储在HDFS、HBase或亚马逊简单存储服务(S3)中的Apache Hadoop数据提供快速、交互式的SQL查询。除了使用相同的统一存储平台,Impala还使用与Apache Hive相同的元数据、SQL语法(Hive SQL)、ODBC驱动程序和用户界面(Hue中的Impala查询UI)。这为实时或面向批处理的查询提供了一个熟悉而统一的平台。

Impala是对可用于查询大数据的工具的补充。Impala并不能取代Hive等基于MapReduce构建的批处理框架。Hive和其他建立在MapReduce上的框架最适合于长期运行的批处理作业,例如涉及提取、转换和加载(ETL)类型作业的批处理。

注:Impala于2017年11月15日从Apache孵化器毕业。在文档中以前提到 "Cloudera Impala "的地方,现在官方名称为 "Apache Impala"。

 

Impala的优势

Impala提供了:

Impala如何与Apache Hadoop合作

Impala解决方案由以下组件组成:

使用Impala执行的查询处理方式如下:

  1. 用户应用程序通过ODBC或JDBC向Impala发送SQL查询,ODBC或JDBC提供标准化的查询接口。用户应用程序可以连接到集群中的任何impalad。这个 impalad 成为查询的协调器。
  2. Impala对查询进行解析和分析,以确定整个集群中的impalad实例需要执行哪些任务。执行计划以达到最佳效率。
  3. HDFS和HBase等服务被本地impalad实例访问以提供数据。
  4. 每个impalad将数据返回给协调impalad,后者将这些结果发送给客户端。

Impala的主要特点

Impala提供了以下支持。

标签:01,impalad,Hive,查询,SQL,Apache,Impala
来源: https://www.cnblogs.com/lukairui/p/14376761.html