其他分享
首页 > 其他分享> > hdfs

hdfs

作者:互联网

hdfs是hadoop负责存储的模块。

分布式存储。

 

比如你有200T的资料。但是你只有200台1T的服务器。那么就可以用hdfs来做分布式存储。

用来管理数据具体存在哪的组件叫namenode。所以namenode就需要高可用,不然你不知道某1T的资料具体存在哪里。这就需要2NN,用来辅助namenode。(具体存文件的元数据,比如文件名,文件属性,目录结构)(2NN每隔一段时间对namenode进行备份)

具体存储数据的组件叫datanode。(具体存文件块,和校验和)

标签:hdfs,存储,1T,具体,namenode,2NN
来源: https://www.cnblogs.com/white-zhan/p/16451288.html