首页 > 代码库 > 【第二天】用kettle向hdfs复制文件

【第二天】用kettle向hdfs复制文件

http://blog.csdn.net/greatelite/article/details/18676281

遇到的问题:

在连接到hdfs服务器上,一直提示unable to connect to HDFS Server

 

解决过程中:

①网上找了各种说是jar包驱动不兼容,端口号不对,最后都没解决

②最后发现,是服务器上hadoop与kettle所用hadoop插件不一致,

服务器上用的是Hadoop 2.0.0-cdh4.5.0,这是一个经过第三方包装过的hadoop,而我在$PDI_HOME/data-integration/plugins/pentaho-big-data-plugin/plugin.properties配置文件中,

active.hadoop.configuration=hadoop-20,应该改为active.hadoop.configuration=cdh42。问题解决,可以成功向hdfs复制文件。