首页 > 代码库 > linux常用編碼處理

linux常用編碼處理

——經驗果然是踩坑才過來的,每一個經驗也許都會隱藏着一次被坑的經歷

<style>p { margin-bottom: 0.1in; line-height: 120% } code.cjk { font-family: "Courier New", monospace }</style>

中文出現亂碼主要因爲編碼不同,編碼不同主要分爲一下兩種情況:

1.文件本身編碼不一致

2.某些軟件自帶轉碼功能

注意:

英文字母也需要轉碼!!!一般情況下沒有影響,但是在某些情況下會導致非常嚴重的影響並且不能找到原因。

Ex: 之前在windowscopy了一份網頁文件,Winodws中文用的是GBK編碼,因爲沒有出現亂碼就沒有進行文件名轉碼,結果導致nginx無法打開某些文件,偶然間發現是文件名編碼問題,然而之前我已經在配置上折騰幾個小時了。

一、應對第一種情況可採用工具轉碼

  • 文件內容轉碼

  • iconv -f FROM_ENCODING -t TO_ENCODING filename

      • -o tofile

ex: iconv -f gbk -t utf-8 filename

  • enconv -L FROM_ENCODING -x(convert to) TO_ENCODING filename

ex: enconv -f zh_CN -t utf-8 filename

  • 文件名轉碼

    • convmv -f FROM_ENCODING -t TO_ENCODING filename

ex: convmv-f gbk -t utf-8 filename

、軟件自帶轉碼功能

  • mount –o iocharset = ENCODING

    ENCODING常用的有:utf8, gbk

  • zip -O CP936

如果不指定編碼則很可能會顯示亂碼。

linux常用編碼處理