其他分享
首页 > 其他分享> > 关于SPARK的 与周边比较

关于SPARK的 与周边比较

作者:互联网

Spark学习笔记(一)之基础篇

2019-11-11 

  333

Spark简介

Spark是美国加州大学伯克利分校的AMP实验室(主要创始人lester和Matei)开发的通用的大数据处理框架.

Spark有4中运行模式:

Spark比MapReduce快的原因

  1. Spark基于内存迭代,而MapReduce基于磁盘迭代
    • MapReduce的设计:中间结果保存到文件,可以提高可靠性,减少内存占用,但是牺牲了性能.
    • Spark的设计:数据在内存中进行交换,要快一些,但是内存这个东西,可靠性比不过MapReduce.
  2. DAG计算模型在迭代计算上还是比MR的更有效率. > 在图论中,如果一个有向图无法从某个顶点出发经过若干条边回到该点,则这个图是一个有向无环图(DAG)
  3. Spark是粗粒度的资源调度,而MR是细粒度的资源调度.

DAG计算模型在Spark任务调度中详解

Spark 计算比 MapReduce 快的根本原因在于DAG计算模型.

Spark 生态系统

Spark生态圈以Spark Core为核心,从HDFS、Amazon S3和HBase等持久层读取数据,以MESS、YARN和自身携带的Standalone为资源管理器调度Job完成Spark应用程序的计算. 这些应用程序可以来自于不同的组件,如Spark的批处理、Spark Streaming的实时处理应用、Spark SQL的即席查询、MLlib的机器学习、GraphX的图处理等等.

Spark Core

Spark Core 是整个 BDAS 生态系统的核心组件,是一个分布式大数据处理框架,Spark Core 提供了多种资源调度管理,通过内存计算、有向无环图(DAG)等机制保证分布式计算的快速,并引入了 RDD 的抽象保证了数据的高容错性.

Spark Streaming

Spark Streaming 是一个对实时数据流进行高吞吐、高容错的流式处理系统,可以对多种数据源进行类似 Map、Reduce 和 Join 等复杂操作,并将结果保存到外部文件系统、数据库或应用到实时仪表盘.

Spark SQL

Hive 是 Shark 的前身,Shark 是 Spark SQL 的前身, Spark SQL 产生的根本原因是其完全脱离了 Hive 的限制.

Spark SQL 性能提升的原因

BlinkDB

BlinkDB 是一个用于海量数据上运行交互式 SQL 查询的大规模并行查询引擎,允许用户通过权衡数据精度来提升响应时间,其数据精度被控制在允许的误差范围内.

MLBase/MLlib

MLBase 是 Spark 中专注于机器学习的组件,目标是让机器学习的门槛更低.

MLBase 与其他机器学习Weka 和Mahout 不同,三者各有特色,具体内容如下.

GraphX

GraphX 最初是伯克利 AMP 实验室的一个分布式图计算框架项目,后整合为 Spark 中成为一个核心组件.在Spark中用于图和图并行计算的API,可认为是 GraphLab 和 Pregel 在 Spark 上的重写及优化.

GraphX 的核心抽象是 Resilient Distributed Property Graph ,一种点和边都带属性的有向多重图. GraphX 扩展了Spark RDD 的抽象,它有 Table 和 Graph 两种视图,但只需要一份物理存储,两种视图都有自己独有的操作符,从而获得了灵活操作和执行效率.GraphX 的整体架构中大部分的实现都是围绕 Partition 的优化进行的,这在某种程度上说明了,点分割的存储和相应的计算优化的确是图计算框架的重点和难点.

Alluxio

Alluxio 是一个分布式内存文件系统,他是一个高容错的分布式文件系统,允许文件以内存的速度在集群框架内进行可靠的共享.

Alluxio 是假设在底层的分布式文件存储和上层的各种计算框架之间的一种中间件.主要职责是将不需要落到 DFS 里的文件,落地到分布式内存文件系统中,来达到共享内存等目的.

最后更新时间:2020-01-21 23:30:36
非常感谢你的阅读, 如果对本文有任何疑问, 可以联系我 liu1011817@gmail.com

正在上传…重新上传取消​windism

 Prev

Spark学习笔记(三)之Spark编程模型上篇

Next 

Spark学习笔记(二)之配置篇

标签:存储,周边,MapReduce,RDD,内存,计算,SPARK,Spark,关于
来源: https://blog.csdn.net/luoyanqing119/article/details/121280653