首页 > 代码库 > 文本处理
文本处理
学习linux后,我们接触图形界面的机会越来越少,服务器基本上没有使用图形界面的,服务器的配置基本上都是定义配置文件,不是图形化的定义服务器,使用文本定义服务器,这样虽然加大了使用难度,但是增加了服务器的高度定制性。既然与文本打交道,那么我们必须掌握管理文本的工具。
1全文查看工具
文本摆在那里,查看文本中的内容后,我们才会具有改变它的资本。
cat [option] arg 查看文本的内容,它默认会把文本中的内容全部显示在命令行中。 Option的含义 -n 显示文本是在行首加入行号 -b 空行不加行号 -A arg就是我们要编辑的文本的路径
less,more
很多配置文件的内容的行数特别多,一个屏幕完全显示不开。换个长得显示器貌似不太好,那么我们只好开发更加人性化的工具。more arg可以打开行数特别多的文本,但是它只可以看完后向后翻页和翻行。Less arg 支持上下翻页查看。
2行查看工具
以上说的都是全文查看工具,less和more以后基本不会用到,接下来说一些行查看工具。
head -#
查看文本的前#行,不写-#默认查看前十行。
tail -#
查看文本的后#行,不写默认查看文本的后十行。
-f 正向文本的全文后,不离开文本,持续监视文本,文本增加任何内容都会显示。这个参数经常用作监视服务器日志。
3文本过滤工具
既然是管理服务器,那么说明服务器的工作形态是不能自动的完成公司的需求,服务器产生的日志可能只有一部分对我们来说是有用的。数据那么多,我们总不能一条条的挑选我们需要的数据吧!淘宝一天几亿次的访问,只成交了几百万单。筛选这些有用的数据那就是必须的了。
cut [option] arg 见名之意,剪切。它以后就是我们修理数据之树的剪刀。 -d ‘ ’ 指定分隔符,默认是tab。日志文件的内容一般都是一段段的,只要我们适当指定分隔符,我们就可以很好的过滤数据。 -f 只指定分隔符是不够的,我们还有指定显示哪一段
sort [option] arg 排序,数据的价值往往是不一样的,我们使用cut拿到需要的数据后,我们还有分析数据找出最有价值的数据。 option的含义 -t ‘’ 指定字段分隔符,和cut的-d类似 -k 指定按照哪个字段排序 -n 安装数值大小排序,默认安装asii排序 -r 反向显示
uniq [option] arg 统计数据,这个命令一般都在sort之后使用,因为这个命令有一个特点,它只统计连续重复的行。 -c 统计数据的行数,并显示在该行重复的次数。 -d 只显示重复的行 -u 显示不重复的行
总结
这些命令单打独斗是完全不行的,当他们和管道、重定向遇到一起,就会发生一个特别神器的化学反应。
本文出自 “老王linux旅程” 博客,请务必保留此出处http://oldking.blog.51cto.com/10402759/1876024
文本处理