第三章 大数据学习之HDFS

xiaoxiao2021-02-28  29

第三章 分布式文件系统HDFS

目标: 兼容廉价的硬件设备 流数据读写 支持大数据集 简单的文件模型 强大的跨平台兼容性

局限性: 不适合低延迟数据访问 无法高效存储大量小文件 不支持多用户写入及任意修改文件

块:默认大小64MB

名称节点(NameNode)DataNode存储元数据存储文件内容元数据保存在内存中文件内容保存在磁盘保存文件,块,datanode之间的映射关系维护了块id到datanode本地文件的映射关系

NameNode保存了两个核心的数据结构:FsImage和EditLog

FsImage文件包含文件系统中所有目录和文件inode的序列化形式。每个inode是一个文件或目录的元数据内部表示,并包含此类信息:文件的复制等级、修改和访问时间、访问权限、块的大小以及组成文件的块。FsImage并没有记录块存储在哪个数据节点。而是由名称节点把这些映射保留在内存中,当数据节点加入HDFS集群时,数据节点会把自己所包含的块列表告知给名称节点,此后会定期执行这种操作,以确保名称节点的块映射是最新的。

第二名称节点1.0版本冷备份,2.0版本热备份。

转载请注明原文地址: https://www.6miu.com/read-1600333.html

最新回复(0)