首页 > 代码库 > linux 通过md5查找重复文件

linux 通过md5查找重复文件

代码如下:

md5sum *|sort  |uniq -w32  -D|awk -F ‘ ‘ ‘{print $2}‘
 uniq          部分参数 

-c             #在每行前显示该行重复次数。
-d             #只输出重复的行。
-D             #只输出重复的行,有几行输出几行。
-f             #-f 忽略的段数,-f 1 忽略第一段。
-i             #不区分大小写。
-w             #忽略第n个字符以后的内容 。
-s             #-s 5忽略后面5个字符

md5sum * 先查看所有文件的md5值,重复的文件的md5值相同。

uniq  处理时是处理相邻两行,所以需要先排序。    

因为处理完后会显示md5值影响观看,可以通过  awk 命令显示文件名

awk -F ‘ ‘ ‘{print $2}‘        #-F指定分隔符,{print $2}指定第几列

linux 通过md5查找重复文件