首页 > 代码库 > 换行符的话题 -- clwu

换行符的话题 -- clwu

 最近不同的开发同事由于在代码文件中采用的 换行符 不同,而导致了在git merge代码阶段diff操作时增加了额外的人工判断成本,

如下图

技术分享

 回顾一下 换行符 的几种标准,来源历史就不说了,可以百度一下。

技术分享

打开任何一个IDE都能看到类似的Code Style设置,Mac(\r) 这种机已经不生产了。

BUT 还有一种 “换行符”,留在文末补充中说。

先上一张  ASCII 表,后面分析问题要用到:man ascii

技术分享

回来说一下我们遇到的问题,初看起来像 图一,就是多了个^M,

但仔细看一下二进制格式(通过xxd可以看到二进制下的情况),就看出是可以分成两种情况的

情况一:就是不同换行符的问题

技术分享

L3有^M,但L4没有^M

技术分享

这种情况下 类似dos2unix 或者tr 命令就可以处理了

情况二:不止是不同换行符,还多了一个\r (0x0D)

技术分享

技术分享

这种情况下 唯有用sed处理了。

 

最后,我们统一为Unix换行符(\n),写个脚本把所有的\r(0x0D)都删除了(不管是情况一还是情况二),再推回git。

 

================= 补充 =================

不知道大家有没有看到 ASCII 表上第一个 NUL 字符,常见的用法是 find -print0 ... | xargs -0 .... 、perl -0 ....

伪换行符一个。

换行符的话题 -- clwu