hdfs
作者:互联网
hdfs是hadoop负责存储的模块。
分布式存储。
比如你有200T的资料。但是你只有200台1T的服务器。那么就可以用hdfs来做分布式存储。
用来管理数据具体存在哪的组件叫namenode。所以namenode就需要高可用,不然你不知道某1T的资料具体存在哪里。这就需要2NN,用来辅助namenode。(具体存文件的元数据,比如文件名,文件属性,目录结构)(2NN每隔一段时间对namenode进行备份)
具体存储数据的组件叫datanode。(具体存文件块,和校验和)
标签:hdfs,存储,1T,具体,namenode,2NN 来源: https://www.cnblogs.com/white-zhan/p/16451288.html