其他分享
首页 > 其他分享> > 大数据 Flink部落 1

大数据 Flink部落 1

作者:互联网

宏观介绍大数据几个基本概念


(刚入大数据的大门,让每一篇文章陪伴我的成长,希望看了文章的同学能够共同进步,相互交流,也希望发现错误能够指正,也希望能和大家一同交流讨论QQ:1793655668)

大数据存储系统

大数据两个主要的存储系统:HDFS和Hbase

大数据批处理系统

批处理比较热门的大数据框架是Hadoop和Spark

Hadoop和Spark的最基本的区别:hadoophe spark 这二者都是大数据框架,即便如此二者各自存在的目的是不同的。Hadoop是一个分布式的数据基础设施,它是将庞大的数据集分派到由若干台计算机组成的集群中的多个节点进行存储。Spark是一个专门用来对那些分布式存储的大数据进行处理的工具,spark本身并不会进行分布式数据的存储。

大数据流处理系统

流处理比较热门的大数据框架是Storm和Flink

简要分析批处理和流处理

简单谈谈四大框架

在批处理中,Hadoop具有更加强大的体系,也是逐渐成为主流;而在流处理中,Flink正在逐渐成为主流,因为flink有着比storm更加先进的框架,而且Flink是支持批处理和流处理。
最后,大家可以自己去详细了解他们的相同之处以及区别。
在许多大公司中,这是支撑亿万数据的基本平台。有人说,大数据会是今后最甜的蛋糕之一

标签:框架,部落,批处理,Flink,Hadoop,处理,数据,分布式
来源: https://blog.csdn.net/weixin_43648214/article/details/105243537