首页 > 代码库 > 文本处理

文本处理

学习linux后,我们接触图形界面的机会越来越少,服务器基本上没有使用图形界面的,服务器的配置基本上都是定义配置文件,不是图形化的定义服务器,使用文本定义服务器,这样虽然加大了使用难度,但是增加了服务器的高度定制性。既然与文本打交道,那么我们必须掌握管理文本的工具。

1全文查看工具

       文本摆在那里,查看文本中的内容后,我们才会具有改变它的资本。

cat [option] arg 查看文本的内容,它默认会把文本中的内容全部显示在命令行中。
       Option的含义
              -n          显示文本是在行首加入行号
              -b          空行不加行号
              -A         
       arg就是我们要编辑的文本的路径


lessmore

       很多配置文件的内容的行数特别多,一个屏幕完全显示不开。换个长得显示器貌似不太好,那么我们只好开发更加人性化的工具。more arg可以打开行数特别多的文本,但是它只可以看完后向后翻页和翻行。Less arg 支持上下翻页查看。

2行查看工具

       以上说的都是全文查看工具,lessmore以后基本不会用到,接下来说一些行查看工具。

       head -#

     

查看文本的前#行,不写-#默认查看前十行。

       tail -#

            

查看文本的后#行,不写默认查看文本的后十行。

              -f                  正向文本的全文后,不离开文本,持续监视文本,文本增加任何内容都会显示。这个参数经常用作监视服务器日志。

3文本过滤工具

       既然是管理服务器,那么说明服务器的工作形态是不能自动的完成公司的需求,服务器产生的日志可能只有一部分对我们来说是有用的。数据那么多,我们总不能一条条的挑选我们需要的数据吧!淘宝一天几亿次的访问,只成交了几百万单。筛选这些有用的数据那就是必须的了。

   

   cut [option] arg
              见名之意,剪切。它以后就是我们修理数据之树的剪刀。
              -d   ‘ ’    指定分隔符,默认是tab。日志文件的内容一般都是一段段的,只要我们适当指定分隔符,我们就可以很好的过滤数据。
              -f                  只指定分隔符是不够的,我们还有指定显示哪一段


   

   sort [option] arg
              排序,数据的价值往往是不一样的,我们使用cut拿到需要的数据后,我们还有分析数据找出最有价值的数据。
       option的含义
              -t    ‘’      指定字段分隔符,和cut的-d类似
              -k                 指定按照哪个字段排序
              -n                 安装数值大小排序,默认安装asii排序
              -r                  反向显示


     

 uniq [option] arg
              统计数据,这个命令一般都在sort之后使用,因为这个命令有一个特点,它只统计连续重复的行。
              -c          统计数据的行数,并显示在该行重复的次数。
              -d          只显示重复的行
              -u          显示不重复的行


总结

       这些命令单打独斗是完全不行的,当他们和管道、重定向遇到一起,就会发生一个特别神器的化学反应。


本文出自 “老王linux旅程” 博客,请务必保留此出处http://oldking.blog.51cto.com/10402759/1876024

文本处理