首页 > 代码库 > Linux下常见的文本处理命令

Linux下常见的文本处理命令

    众所周知,在Linux下"一切皆文件"的原则,一切配置文件都可以以文本的方式进行编辑、存储。故对文本文件的操作能力,决定着你是否能够在Linux下操纵自如。今天,就写下几个关于Linux下一些常用的文本处理命令。


1、文本文件查看命令:cat、more、less、head、tail


1.1 cat命令:连接并显示,当文本文件有多个时,将其连接并一个一个的完整地显示出来

    eg:

        cat /etc/inittab 

        cat /etc/fstab

        cat /etc/inittab /etc/fstab


    cat主要有三大功能:
        1.一次显示整个文件。# cat filename
        2.从键盘创建一个文件。# cat > filename  
               只能创建新文件,不能编辑已有文件.
        3.将几个文件合并为一个文件: # cat file1 file2 > file

          

    cat命令的常用参数:

        cat -n 或 --number 由 1 开始对所有输出的行数编号

        cat -E 显示文本文件的行结束符

                Linux的行结束符为$,而windows的行结束符为$+回车,

                故在Linux上编辑的文本文件在windows中显示,都是只有一行

        cat命令,以ctrl+c结束 、运行在bash之上;


1.2 文件查看之分屏显示:more、less、head、tail


more命令:more命令,功能类似 cat ,cat命令是整个文件的内容从上到下显示在屏幕上。 more会以一页一页的显示方便使用者逐页阅读。more命令从前向后读取文件,因此在启动时就加载整个文件。


   严格来说more命令只能实现"向后翻页",因为要想实现"往前翻页",当前光标必须是不在文件的尾部

        空格键 space(向后一屏)

        b键    back (向前一屏)

        回车        (向后一行)

        /          (搜寻字串)


less命令:less 工具也是对文件或其它输出进行分页显示的工具,应该说是linux正统查看文件内容的工具,功能极其强大。less 的用法比起 more 更加的有弹性。


在 more 的时候,我们并没有办法向前面翻, 只能往后面看,但若使用了 less 时,就可以使用 [pageup] [pagedown] 等按键的功能来往前往后翻看文件,更容易用来查看一个文件的内容!除此之外,在 less 里头可以拥有更多的搜索功能,不止可以向下搜,也可以向上搜。 less 在查看之前不会加载整个文件


        空格键 space(向后一屏)

        b键    back (向前一屏)

        回车        (向后一行)

        /          (搜寻字串)

        pgup       (向上一页)

        pgdn       (向下一页)

        /          (搜寻字串)

        ?          (搜寻字串)



head命令:head 用来显示档案的开头至标准输出中,默认head命令打印其相应文件的开头10行。

            查看文件的前n行,默认前10行

                -n num:前num行


tail命令:tail 命令从指定点开始将文件写到标准输出. 


            -n num:查看文件尾部后num行

            -f:查看文件尾部、不退出、等待显示后续追加至此文件的新内容         

                使用tail命令的-f选项可以方便的查阅正在改变的日志文件

                tail -f filename会把filename里最尾部的内容显示在屏幕上

               并且不断刷新,使你看到最新的文件内容.


三大利器:(必须会)

    sed(文本处理类)、awk(文本处理类)、grap(文本查找类)


2、文本处理相关的命令:cut(剪切)、join(合并)、sed、awk

2.1 cut命令:详细内容,可以看我的博客:文本处理类命令之cut命令详解

            -d:指定字段分隔符,默认是空格

    -f:指定要显示的字段,

                -f 1

        -f 1,3(显示第1和第3个属性值,离散表示法)

                -f 1-3(显示第1到第3个属性值,连续表示法)


2.2 文本排序命令:sort、uniq

    文本排序:

        sort(并不影响原文件中的内容,只是影响显示内容,相当于视图,默认升序,ASCII)

    -n(按照数字大小排序,而非默认的ASCII码)

    -r(逆序排列,可以和-n一起使用)

    -t(字段分隔符)

    -k(以哪个字段为关键字排序)

    -u(排序后相同的行,只显示一次)

    -f(排序时,忽略字符大小写)

                关于sort命令的详解:请看我的博客——Linux下的文本排序命令之sort命令详解


        

        uniq (报告和忽略重复的行),什么是重复的行:内容一致,互为相邻

    -d:只显示重复的行

    -D:

    -c:显示文件中行重复的次数


        

        uniq命令的功能是去掉文件中重复行输出。(不改变原文件)

 

        uniq --help 可查看命令参数使用方法。

 

        uniq file1 显示file1中内容,重复行只显示一次。

 

      uniq -c file1 显示file1中内容,重复行只显示一次。在每行前面列出本行在文件中出现几次。

 

        uniq -d file1 只显示file1中重复出现的行,且重复行只显示一次。

   

        uniq -D file1 只显示file1中重复出现的行,且重复行全部显示。

 

        uniq -f 2 file1 忽略每行前两个词,显示file1中内容,重复行只显示一次。

 

        uniq -i file1 忽略大小,显示file1中内容,重复行只显示一次。

 

        uniq -s 5 file1 忽略每行前5个字母,显示file1中内容,重复行只显示一次。

 

        uniq -u file1 只显示file1中不重复的行。

 

        uniq -w 5 file1 只比较每行前5个字母,显示file1中内容,重复的只显示一次。


2.3 文本统计命令之wc命令

文本统计:

wc:(统计一个文本中的:行数,单词数,字符数)

wc /etc/fstab

wc -l /etc/fstab统计行数

wc -w /etc/fstab统计单词数

wc -c /etc/fstab统计字节数

wc -m /etc/fstab统计字符数

wc -L /etc/fstab显示最长的一行包含多少个字符


2.4 字符处理命令之tr命令

    字符处理命令:

tr:转换或删除字符

tr [OPTION]... SET1 [SET2]

SET表示字符集

如:tr ab AB

一个一个字符比较

-d 删除字符集中出现的所有字符,只需要给定一个字符集即可


        详细请看我的博客:Linux下的字符处理命令之tr命令详解




Linux下常见的文本处理命令的归纳总结:

          1、文本文件查看命令:cat、more、less、head、tail

         2、文本处理相关的命令:cut(剪切)、join(合并)、sed、awk

         3、文本排序命令:sort、uniq

         4、文本统计命令之wc命令

         5、字符处理命令之tr命令


  

Linux下常见的文本处理命令