首页 > 代码库 > 正则表达式
正则表达式
此处命名为正则表达式可能不太恰当,大都是一些可能是shell脚本中用到的命令,暂时这样称呼,当然这些命令确实和正则表达式关系密切。
1.grep
grep -n ‘^a’ filename #-n 打印所过滤出行的行号 过滤以某字符为开头的行
grep -n ‘^[a-z]‘ filename 过滤以小写字母为开的行
grep ‘^$‘ filename 打印为空行的行号
grep -n ‘\.$‘ 打印以小数点为结尾的行
ps: $代表结尾
^代表开头
grep -v ‘^$‘ filename 打印不为空的行
-v 反义,意为不包含某参数的行
grep -v ‘set‘ filename 打印文件中不包含set的行
grep 常用参数:
-c 只输出匹配行的计数
-i 不区分大小写(只适用于单字符)
-n 显示匹配行及行号
-s 不显示不存在或无匹配文本的错误信息
-v 显示不包含匹配文本的所有行
2.sed [d删除 c替换 s 搜索替换]
sed ‘n1,n2 d‘
sed -i s/a/b/g filename 替换后并写入源文件
3.awk是个非常牛逼的程序
awk 命令1,命令2,命令3
awk ‘{print NR,NF,$1,$NF,}‘ file 显示文件file的当前记录号、域数和每一行的第一个和最后一个域。
FS 分隔符
NR 当前为第几行
FN 当前有几个字段
awk 默认的分隔符是一个空格
4.last 这个月的登陆信息
5.cut
-d -f 结合作用,-d后接分隔符,-f后接数字。意为打印出以-d(后接内容)为分隔符分隔成的第几部分
如: cut -d ‘_‘ -f 3 string_line 即为打印出以_为分隔符的第3部分,若没有第三部分则打印出为空
-c 以字符为单位取出固定范围的字符
cut -c 20-25 即取出这一行第20到第25个字符
6.uniq
过滤重复内容
uniq -c 在列边显示该行出现的次数
7.sort (排序)
-f 忽略大小写
-b 忽略空格
-r 反向排序
-u 滤重
-t 分隔符,默认为tab
-k 按哪个字段来排序
8.split -bl prefix(文件名头)
-b 按大小拆分 后接文件太小 ( 400b/400K/400m等)
-l 按行拆分
9.print
PS:以上命令可通过管道连接使用,以完成一些文本的处理
本文出自 “暮雨听涛” 博客,请务必保留此出处http://gtlinux.blog.51cto.com/1047916/1540667