首页 > 代码库 > sqoop 导入数据到HDFS注意事项

sqoop 导入数据到HDFS注意事项

今天碰到不少问题,记录一下。

分割符的方向问题

首先sqoop的参数要小心, 从数据库导出数据,写到HDFS的文件中的时候,字段分割符号和行分割符号必须要用

--fields-terminated-by

而不能是

--input-fields-terminated-by

--input前缀的使用于读文件的分割符号,便于解析文件,所以用于从HDFS文件导出到某个数据库的场景。

两个方向不一样。


参数必须用单引号括起来

官方文档的例子是错的:

The octal representation of a UTF-8 character’s code point. This should be of the form \0ooo, where ooo is the octal value. For example, --fields-terminated-by \001 would yield the ^A character.

应该写成

--fields-terminated-by ‘\001‘