首页 > 代码库 > hadoop 启动的时候datanode报错 Problem connecting to server

hadoop 启动的时候datanode报错 Problem connecting to server

刚配置好的hadoop,namenode可以正常开启,但是datanode却不停的报错,并且不能正常启动:

 

2014-05-04 10:43:33,970 WARNorg.apache.hadoop.hdfs.server.datanode.DataNode: Problem connecting to server:hadoop1/192.168.10.22:9000

 

2014-05-04 10:43:55,009 INFOorg.apache.hadoop.ipc.Client: Retrying connect to server:hadoop1/192.168.10.22:9000. Already tried 0 time(s); retry policy isRetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1 SECONDS)

2014-05-04 10:43:56,012 INFOorg.apache.hadoop.ipc.Client: Retrying connect to server:hadoop1/192.168.10.22:9000. Already tried 1 time(s); retry policy isRetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1 SECONDS)

 

 

如果你已经检查了datanode以及namenode的连通性,ip都正确,但是仍然没法解决问题,那么可以接着往下看了。

 

其实根本原因还是无法连接到192.168.10.22:9000 相应ip的相应端口。

 

查看一下namenode的端口坚挺情况:

 

[hdp@hadoop1 sbin]$ netstat -an | grep 9000

tcp        0      0 127.0.0.1:9000              0.0.0.0:*                   LISTEN     

tcp        0     0 127.0.0.1:37072            127.0.0.1:9000             TIME_WAIT  

 

其实问题就再这里,hadoop启动的时候只监听了127.0.0.1一个端口,而不是192.168.10.22:9000。这种情况下,也就只有本机才能联通127.0.0.1:9000了。

 

看来是ip解析的问题,看一下namenode的hosts文件(只列出了重要部分):

 

127.0.0.1              hadoop1localhost.localdomainlocalhost

::1            localhost6.localdomain6 localhost6

 

其实主要问题就在标红的部分,只要将hadoop1去掉即可。

 

重启hdfs后检查一下端口监听情况:

 

[root@hadoop1 network-scripts]# netstat -an | grep 9000

tcp        0      0 192.168.10.22:9000          0.0.0.0:*                   LISTEN     

tcp        0      0 192.168.10.22:9000          192.168.10.24:51040         ESTABLISHED

tcp        0      0 192.168.10.22:41116         192.168.10.22:9000          TIME_WAIT  

tcp        0      0 192.168.10.22:9000          192.168.10.23:46070         ESTABLISHED

 

修改后datanode就可以正常连接namenode了。