Hadoop入门(1)——Hadoop概论
作者:互联网
大数据
大数据(Big Data):指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现里和流程优化能力的海量、高增长率和多样化的信息资产。通常都是 TB、PB、EB级别的数据。
大数据主要解决海量数据的采集、存储和分析计算问题。
大数据的特点(4V):
● 大量(Volume)
● 高速(Velocity)
● 多样(Variety)
● 低价值密度(Value)
Hadoop概述
Hadoop 是由Apache基金会所开发的分布式系统基础架构。
主要解决海量数据的存储和海量数据的分析计算。
官网地址:https://hadoop.apache.org/
通常说的Hadoop,一般指广义上的Hadoop,即Hadoop生态圈,包括Hbase、Hive、ZooKeeper等。
标签:存储,入门,海量,Hadoop,基础架构,分布式系统,数据,概论 来源: https://www.cnblogs.com/CQCx64/p/16537133.html