其他分享
首页 > 其他分享> > 云小课 | MRS和自建Hadoop相比,有哪些优势?

云小课 | MRS和自建Hadoop相比,有哪些优势?

作者:互联网

大数据时代企业要发展就必须进行数字化转型,要完成转型,企业需要利用大数据技术打破现有数据孤岛,构建数据分析和运营能力,才能达到降本增效。企业构建大数据平台时会面临如下两种选择:一种是大量购买机器及Hadoop发现商版本,本地自建Hadoop大数据集群;一种是按企业自身的需求,购买公有云大数据云服务构建自己的云上大数据平台。

企业该如何选择呢?云小课为您解读华为云大数据云服务MRS相比自建Hadoop集群的优势,帮助您更好的进行选择。

MapReduce服务(MRS)提供租户完全可控的企业级大数据集群云服务,轻松运行Hadoop、Spark、HBase、Kafka、Storm等大数据组件,用户无需关注硬件的购买和维护。MRS服务拥有强大的Hadoop内核团队,基于华为FusionInsight大数据企业级平台构筑,历经行业数万节点部署量的考验,提供多级用户SLA保障。与自建Hadoop集群相比,MRS还具有以下优势:

1. MRS支持一键式创建、删除、扩缩容集群,并通过弹性公网IP便携访问MRS集群管理系统,让大数据集群更加易于使用。

2. MRS支持自动弹性伸缩,相对自建Hadoop集群的使用成本更低。

MRS可以按业务峰谷,自动弹性伸缩,在业务繁忙时申请额外资源,业务不繁忙时释放闲置资源,让用户按需使用,帮助用户节省大数据平台闲时资源,尽可能的帮助用户降低使用成本,聚焦核心业务。

在大数据应用,尤其是周期性的数据分析处理场景中,需要根据业务数据的周期变化,动态调整集群计算资源以满足业务需要。MRS的弹性伸缩规则功能支持根据集群负载对集群进行弹性伸缩。此外,如果数据量为周期有规律的变化,并且希望在数据量变化前提前完成集群的扩缩容,可以使用MRS的资源计划特性。MRS服务支持规则和时间计划两种弹性伸缩的策略:

弹性伸缩规则与资源计划均可触发弹性伸缩,两者即可同时配置也可单独配置。资源计划与基于负载的弹性伸缩规则叠加使用可以使得集群节点的弹性更好,足以应对偶尔超出预期的数据峰值出现。

3. MRS支持存算分离,大幅提升大数据集群资源利用率。

针对传统存算一体大数据架构中扩容困难、资源利用率低等问题,MRS采用计算存储分离架构,存储基于公有云对象存储实现11个9的高可靠,无限容量,支撑企业数据量持续增长;计算资源支持0~N弹性扩缩,百节点快速发放。存算分离后,计算节点可实现真正的极致弹性伸缩;数据存储部分基于OBS的跨AZ等能力实现更高可靠性,无需担心地震、挖断光纤等突发事件。存储和计算资源可以灵活配置,根据业务需要各自独立进行弹性扩展,可使资源匹配更精准、更合理,让大数据集群资源利用率大幅提升,综合分析成本降低50%。

同时通过高性能的计算存储分离架构,打破存算一体架构并行计算的限制,最大化发挥对象存储的高带宽、高并发的特点,对数据访问效率和并行计算深度优化(元数据操作、写入算法优化等),实现性能提升。

4. MRS支持自研CarbonData和自研超级调度器Superior Scheduler,性能更优。

5. MRS基于鲲鹏处理器进行软硬件垂直优化,充分释放硬件算力,实现高性价比。

MRS支持华为自研鲲鹏服务器,充分利用鲲鹏多核高并发能力,提供芯片级的全栈自主优化能力,使用华为自研的操作系统EulerOS、华为JDK及数据加速层,充分释放硬件算力,为大数据计算提供高算力输出。在性能相当情况下,端到端的大数据解决方案成本下降30%。

6. MRS支持多种隔离模式及企业级的大数据多租户权限管理能力,安全性更高。

7. MRS管理节点均实现HA,支持完备的可靠性机制,让系统更加可靠。

MRS在基于Apache Hadoop开源软件的基础上,在主要业务部件的可靠性方面进行了优化和提升。

Hadoop开源版本的数据、计算节点已经是按照分布式系统进行设计的,单节点故障不影响系统整体运行;而以集中模式运作的管理节点可能出现的单点故障,就成为整个系统可靠性的短板。

MRS对所有业务组件的管理节点都提供了类似的双机的机制,包括MRS Manager、Presto、HDFS NameNode、Hive Server、HBase HMaster、YARN Resources Manager、Kerberos Server、Ldap Server等,全部采用主备或负荷分担配置,有效避免了单点故障场景对系统可靠性的影响。

通过可靠性分析方法,梳理软件、硬件异常场景下的处理措施,提升系统的可靠性。

8. MRS提供统一的可视化大数据集群管理界面,让运维人员更加轻松。

9. MRS具有开放的生态,支持无缝对接周边服务,快速构建统一大数据平台。

 


标签:云小课,Hadoop,支持,用户,集群,MRS,数据,资源
来源: https://blog.51cto.com/u_15214399/2808588