首页 > 代码库 > 【文本处理】awk、sed使用 - 二
【文本处理】awk、sed使用 - 二
一些例子。
1、显示gopher帐号所在行至最后一行。
awk ‘/^gopher/{row=NR;while(getline < "passwd" ){++i;FS=":";if(i>=row){print $0}}}‘ passwd
getline < "filename" 若读取成功,则返回非0,当读文件完后,会返回0。
awk -F: ‘NR==FNR{if($1 ~ /^gopher/){row=NR};next}{if (FNR>=row){print $0}}‘ passwd passwd
用NR==FNR方法。
awk ‘/^gopher/{p=1}p‘ passwd
awk变量若是没有赋值,那么他的初始为0或空。另外1默认是1{print}
sed -n ‘/^gopher/,$p‘ passwd sed ‘/^gopher/,$ !d‘ passwd
2、提取网卡名称、mac地址、ip地址用一行显示
[root@localhost awk]# cat k eth0 Link encap:Ethernet HWaddr 00:50:56:8A:1E:24 inet addr:10.16.66.106 Bcast:10.16.66.255 Mask:255.255.255.0 inet6 addr: fe80::250:56ff:fe8a:1e24/64 Scope:Link UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:19838444 errors:0 dropped:0 overruns:0 frame:0 TX packets:446941 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:1000 RX bytes:1630611345 (1.5 GiB) TX bytes:65236241 (62.2 MiB) Base address:0x2000 Memory:d1020000-d1040000 lo Link encap:Local Loopback inet addr:127.0.0.1 Mask:255.0.0.0 inet6 addr: ::1/128 Scope:Host UP LOOPBACK RUNNING MTU:16436 Metric:1 RX packets:7319 errors:0 dropped:0 overruns:0 frame:0 TX packets:7319 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:0 RX bytes:3808487 (3.6 MiB) TX bytes:3808487 (3.6 MiB) eth1 Link encap:Ethernet HWaddr 00:50:56:8A:1E:24 inet addr:172.16.66.106 Bcast:10.16.66.255 Mask:255.255.255.0 inet6 addr: fe80::250:56ff:fe8a:1e24/64 Scope:Link UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:19838444 errors:0 dropped:0 overruns:0 frame:0 TX packets:446941 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:1000 RX bytes:1630611345 (1.5 GiB) TX bytes:65236241 (62.2 MiB) Base address:0x2000 Memory:d1020000-d1040000
[root@localhost awk]# sed -r -n ‘/^eth/{s/(eth[0-9]).*HWaddr (.*)/\1 \2/;h;n;s/.*inet addr:(.*)Bcast.*/\1/;H;x;s/\n//p}‘ k eth0 00:50:56:8A:1E:24 10.16.66.106 eth1 00:50:56:8A:1E:24 172.16.66.106 awk ‘/^eth/{x= $1" "$(NF);i=NR}{if (NR == i+1){x= x " "gensub(/.*addr:(.*)Bcast.*/,"\\1","g",$0);print x;x=""}}‘ k eth0 00:50:56:8A:1E:24 10.16.66.106 eth1 00:50:56:8A:1E:24 172.16.66.106
3、sub、gsub、match、gensub使用
sub使用:
sub(/正则/,"替换匹配到的字符串","要处理的字符串,默认是$0")
返回值:指替换正则的个数
sub的结果会修改原字符串,比如$0
只能替换第一个匹配到的值。
例:
[root@localhost awk]# cat a 1 a b 2 c d 3 huang xuewen 4 xx huang aa huang [root@localhost awk]# [root@localhost awk]# awk ‘{a=sub(/huang/,"ooo",$0);print a"==="$0}‘ a 0===1 a b 0===2 c d 1===3 ooo xuewen 1===4 xx ooo aa huang [root@localhost awk]#
gsub使用:
gsub与sub用法基本一样,sub只替换第一个匹配到的值,gsub替换所有匹配到的值。
[root@localhost awk]# cat a 1 a b 2 c d 3 huang xuewen 4 xx huang aa huang 5 xx huang aa huang xabc huang a [root@localhost awk]# awk ‘{a=gsub(/huang/,"ooo",$0);print a"==="$0}‘ a 0===1 a b 0===2 c d 1===3 ooo xuewen 2===4 xx ooo aa ooo 3===5 xx ooo aa ooo xabc ooo a [root@localhost awk]#
match使用:
match("原字符串","正则表达式",array)
返回值:若匹配到,则会返回匹配的位置,若是没有匹配到,则返回0
可以分组表示,若正则表达式中使用(引起的内容),那么会存放到array数据中。可以用array[1]表示第一个匹配到的分组内容。
[root@localhost awk]# cat k1 inet addr:10.16.66.106 Bcast:10.16.66.255 Mask:255.255.255.0 inet addr:172.16.66.168 Bcast:172.16.66.255 Mask:255.255.255.0 [root@localhost awk]# awk ‘{if(match($0,"[^:]*:([^ ]*).*Bcast:([^ ]*).*",a))print a[1],a[2] }‘ k1 10.16.66.106 10.16.66.255 172.16.66.168 172.16.66.255
gensub使用:
gensub("正则表达式","要替换表达式的字符串","1或g","处理的字符串")
1表示只替换一个,g替换所有
返回值
1、使用普通的值替换正则表达式,返回的是替换后的值。
2、若是使用\\1 这个表示返回的值是正则表达式中(引起的内容),\\2表示第二个
下面的正则乱写的。
[root@localhost awk]# cat k1 inet addr:10.16.66.106 Bcast:10.16.66.255 Mask:255.255.255.0 inet addr:172.16.66.168 Bcast:172.16.66.255 Mask:255.255.255.0 [root@localhost awk]# awk ‘{s=gensub("[^:]*:([^ ]*).*","hxw",1,$0);print s}‘ k1 hxw hxw [root@localhost awk]# awk ‘{s=gensub("[^:]*:([^ ]*).*","\\1",1,$0);print s}‘ k1 10.16.66.106 172.16.66.168
本文出自 “尽管错,让我错到死!” 博客,请务必保留此出处http://hxw168.blog.51cto.com/8718136/1440229
【文本处理】awk、sed使用 - 二