首页 > 代码库 > Hadoop分布式文件系统个人通俗理解

Hadoop分布式文件系统个人通俗理解

Hadoop分布式文件系统分为三部分:ClientNode,NameNode,DataNode(n个),之间通过TCP/IP进行通信。

CN:1.提供给客户接口,向NN发送读写等命令

2.根据NN提供的信息,向多个DN中写入,或从中读取。

NN:1.管理文件系统的名字空间

2.管理CN对文件的访问

DN:负责管理节点的文件存储

Operation:

Read:1.CN向NN发送读取文件的请求

    2.NN告诉CN,你要读的文件都以什么样的顺序,存储在哪些DN中

    3.CN根据NN提供的信息,按顺序去读相应的DN。(一个文件被存储在多个DN中)

Write:1.CN向NN发送写文件的请求

    2.NN根据CN要写的文件的大小以及存储该文件的DN的情况,向CN提供DN的信息

    3.CN将文件分成多份,把每一份按顺序写到每一个DN中。(每次只能有一                        个写入者,并且写入应一气呵成)


Others:图中应该有一个DN备份的过程,这是Hadoop文件系统的一种容错的安全机制。


Hadoop分布式文件系统个人通俗理解