Hadoop中文编码乱码相关问题

首页 > 代码库 > Hadoop中文编码乱码相关问题

Hadoop中文编码乱码相关问题

2024-09-22 17:35:45 216人阅读

mapreduce程序处理GBK编码数据并输出GBK编码数据, hadoop涉及输出文本的默认输出编码统一用没有BOM的UTF-8的形式，但是对于中文的输出window系统默认的是GBK，有些格式文件例如CSV格式的文件用excel打开输出编码为没有BOM的UTF-8文件时，输出的结果为乱码，只能由UE或者记事本打开才能正常显示。因此将hadoop默认输出编码更改为GBK成为非常常见的需求，具体请参考以下这篇帖子http://www.aboutyun.com/thread-7358-1-1.html

Hadoop中文编码乱码相关问题

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > Hadoop中文编码乱码相关问题

Hadoop中文编码乱码相关问题

看完仍有疑问？有类似问题直接问程序猿