首页 > 代码库 > Hadoop分布式文件系统个人通俗理解
Hadoop分布式文件系统个人通俗理解
Hadoop分布式文件系统分为三部分:ClientNode,NameNode,DataNode(n个),之间通过TCP/IP进行通信。
CN:1.提供给客户接口,向NN发送读写等命令
2.根据NN提供的信息,向多个DN中写入,或从中读取。
NN:1.管理文件系统的名字空间
2.管理CN对文件的访问
DN:负责管理节点的文件存储
Operation:
Read:1.CN向NN发送读取文件的请求
2.NN告诉CN,你要读的文件都以什么样的顺序,存储在哪些DN中
3.CN根据NN提供的信息,按顺序去读相应的DN。(一个文件被存储在多个DN中)
Write:1.CN向NN发送写文件的请求
2.NN根据CN要写的文件的大小以及存储该文件的DN的情况,向CN提供DN的信息
3.CN将文件分成多份,把每一份按顺序写到每一个DN中。(每次只能有一 个写入者,并且写入应一气呵成)
Others:图中应该有一个DN备份的过程,这是Hadoop文件系统的一种容错的安全机制。
Hadoop分布式文件系统个人通俗理解
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。