手机版
你好,游客 登录 注册
背景:
阅读新闻

Linux高级文本处理之gawk变量的操作符

[日期:2017-02-07] 来源:Linux社区  作者:yolynn [字体: ]

一、变量

Awk 变量以字母开头,后续字符可以是数字、字母、或下划线。关键字不能用作 awk 变量。awk 变量可以直接使用而不需事先声明。 如果要初始化变量,最好在BEGIN 区域内做,它只会执行一次。Awk 中没有数据类型的概念,一个 awk 变量是 number 还是 string 取决于该变量所处的上下文。

实例1:使用”total”便是用户建立的用来存储公司所有雇员工资总和的变量。

[root@localhost ~]# cat emp4
101,John Doe,CEO,10000
102,Jason Smith,IT Manager,5000
103,Raj Reddy,Sysadmin,4500
104,Anand Ram,Developer,4500
105,Jane Miller,Sales Manager,3000

[root@localhost ~]# cat emp.awk 
BEGIN{
        FS=",";
        total=0;
}

{
        print $2 "'s salary is:" $4;
        total=total+$4;
}

END{
        print "---\nTotal company salary=$"total;
}

[root@localhost ~]# awk -f emp.awk emp4
John Doe's salary is:10000
Jason Smith's salary is:5000
Raj Reddy's salary is:4500
Anand Ram's salary is:4500
Jane Miller's salary is:3000
---
Total company salary=$27000

awk自定义变量的方法:

1.借助-v选项,可以将外部值(并非来自stdin)传递给awk

 

实例2:

1
2
3
4
5
6
[root@localhost ~]# awk -v var="young" 'BEGIN{print var,"\n","---"}{print var}' ./num
young 
 ---
young
young
young

2.通过VAR=value的方式定义

 

实例3:

1
2
3
4
[root@localhost ~]# awk '{print v1,v2}' v1="young" v2="geek" ./num
young geek
young geek
young geek

 

 

 

二、一元操作符

cb962517ab27cac2.png

1.取正取反

只接受单个操作数的操作符叫做一元操作符。

实例1:取反操作

[root@localhost ~]# cat emp4
101,John Doe,CEO,10000
102,Jason Smith,IT Manager,5000
103,Raj Reddy,Sysadmin,4500
104,Anand Ram,Developer,4500
105,Jane Miller,Sales Manager,3000
[root@localhost ~]# awk -F, '{print -$4}' emp4
-10000
-5000
-4500
-4500
-3000

注意:取反只对数值类数据生效,字符串取反结果全部为0.

实例2:

[root@localhost ~]# cat num
-1
-2
-3
[root@localhost ~]# awk '{print +$1}' num
-1
-2
-3
[root@localhost ~]# awk '{print -$1}' num 
1
2
3

2.自增自减

VAR1=++VAR或者VAR1=--VAR,表示VAR先增加或者减去1再赋值给VAR1,VAR1=VAR++或VAR1=VAR--,表示先将VAR赋值给VAR1,VAR再增减或者减去1.

实例1:前自加子减

[root@localhost ~]# awk -F, '{print ++$4}' emp4 #前自加
10001
5001
4501
4501
3001
[root@localhost ~]# awk -F, '{print --$4}' emp4  #前自减
9999
4999
4499
4499

实例2:后自加子减

[root@localhost ~]# awk -F, '{$4--;print $4}' emp4  #后自减
9999
4999
4499
4499
2999
[root@localhost ~]# awk -F, '{$4++;print $4}' emp4  #后自加
10001
5001
4501
4501
3001

实例3:打印所有可登陆 shell 的用户总数:

[root@localhost ~]# awk -F':' 
>'$NF ~ /\/bin\/bash/ { n++ }
> END { print n }' /etc/passwd
10

[root@localhost ~]# grep -c '/bin/bash$' /etc/passwd
10

实例4:

[root@localhost ~]# cat num
1
2
1
1
3
4
2
[root@localhost ~]# awk '/1/{print NF}' num
1
1
1
[root@localhost ~]# awk '/1/{n++}END{print n}' num        
3
[root@localhost ~]# awk '/2/{n++}END{print n}' num 
2
[root@localhost ~]# awk '/3/{n++}END{print n}' num 
1
[root@localhost ~]# awk '/4/{n++}END{print n}' num 
1

三、算术运算符

需要两个操作数的操作符,成为二元操作符。 Awk 中有多种基本二元操作符(如算术操作符、 字符串操作符、赋值操作符,等等)。

8437c5b680df3286.png

实例1:将每件单独的商品价格减少 20% 并且将每件单独的商品的数量减少 1

[root@localhost ~]# cat items.txt 
101,HD Camcorder,Video,210,10
102,Refrigerator,Appliance,850,2
103,MP3 Player,Audio,270,15
104,Tennis Racket,Sports,190,20
105,Laser Printer,Office,475,5
[root@localhost ~]# cat dis.awk 
BEGIN{
FS=",";
OFS=",";
discount=0
}
{
discount=$4*20/100;
print $1,$2,$3,$4-discount,$5-1
}
[root@localhost ~]# awk -f dis.awk items.txt 
101,HD Camcorder,Video,168,9
102,Refrigerator,Appliance,680,1
103,MP3 Player,Audio,216,14
104,Tennis Racket,Sports,152,19
105,Laser Printer,Office,380,4

实例2:只打印偶数行

[root@localhost ~]# awk 'NR%2==0' items.txt                 
102,Refrigerator,Appliance,850,2
104,Tennis Racket,Sports,190,20

四、字符串操作符

(空格)是连接字符串的操作符。

实例1:

[root@localhost ~]# cat str.awk 
BEGIN{

        FS=",";
        OFS=",";
        str1="Audio";
        str2="Video";
        nustr="100";
        str3=str1 str2;
        print "Concatenate string is:"str3;
        nustr=nustr+1;
        print "Str to nu:"nustr;
}
[root@localhost ~]# awk -f str.awk items.txt 
Concatenate string is:AudioVideo
Str to nu:101

四、赋值操作符

1acc77933c0afe17.png

实例1:

[root@localhost ~]# cat fz.awk 
BEGIN {
FS=",";
OFS=",";
total1 = total2 = total3 = total4 = total5 = 10;
total1 += 5; print total1;
total2 -= 5; print total2;
total3 *= 5; print total3;
total4 /= 5; print total4;
total5 %= 5; print total5;
}
[root@localhost ~]# awk -f fz.awk items.txt 
15
5
50
2
0

实例2:打印商品清单

[root@localhost ~]# cat items.txt 
101,HD Camcorder,Video,210,10
102,Refrigerator,Appliance,850,2
103,MP3 Player,Audio,270,15
104,Tennis Racket,Sports,190,20
105,Laser Printer,Office,475,5  

[root@localhost ~]# awk -F, '
>BEGIN{ total=0} { total +=$5 } 
>END { print "Total Qutantity:" total }' items.txt
Total Qutantity:52

五、比较操作符

39b85875ade6d268.png

实例1:打印数量小于等于临界值 5 的商品信息

[root@localhost ~]# awk -F, '$5<=5' items.txt         
102,Refrigerator,Appliance,850,2
105,Laser Printer,Office,475,5

实例2:打印编号为 103 的商品信息

[root@localhost ~]# awk -F, '$1==103' items.txt 
103,MP3 Player,Audio,270,15

实例3:打印除 Video 以外的所有商品

[root@localhost ~]# awk -F, '$3!="Video"' items.txt 
102,Refrigerator,Appliance,850,2
103,MP3 Player,Audio,270,15
104,Tennis Racket,Sports,190,20
105,Laser Printer,Office,475,5

实例4:同实例3,但只打印描述信息

[root@localhost ~]# awk -F, '$3!="Video"{print $2}' items.txt 
Refrigerator
MP3 Player
Tennis Racket
Laser Printer

实例5:打印价钱低于 900 或者数量小于等于临界值 5 的商品信息

[root@localhost ~]# awk -F, '$5<=5||$4<900' items.txt 
101,HD Camcorder,Video,210,10
102,Refrigerator,Appliance,850,2
103,MP3 Player,Audio,270,15
104,Tennis Racket,Sports,190,20
105,Laser Printer,Office,475,5

实例6:打印/etc/password 中最大的 UID(以及其所在的整行)。

[root@localhost ~]# awk -F ':' '
>$3 > maxuid 
>{ maxuid = $3; maxline = $0 } 
>END { print maxuid,maxline }' /etc/passwd
1009 user3:x:1009:1010::/home/user3:/bin/bash

实例8:打印/etc/passwd 中 UID 和 GROUP ID 相同的用户信息

[root@localhost ~]# awk -F ':' '$3 == $4' /etc/passwd
root:x:0:0:young,geek,010110110,0101101101:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
nobody:x:99:99:Nobody:/:/sbin/nologin
dbus:x:81:81:System message bus:/:/sbin/nologin
vcsa:x:69:69:virtual console memory owner:/dev:/sbin/nologin
abrt:x:173:173::/etc/abrt:/sbin/nologin

实例9:打印/etc/passwd 中 UID >= 100 并且用户的 shell 是/bin/sh 的用户

[root@localhost ~]# awk -F: '$3 >= 100 && $7 == "/bin/sh"' /etc/passwd 
user1:x:800:800:test user:/none:/bin/sh

或者:

[root@localhost ~]# awk -F ':' '$3 >= 100 && $NF ~ /\/bin\/sh/' /etc/passwd
user1:x:800:800:test user:/none:/bin/sh       #正则表达式模式匹配

实例10:打印/etc/passwd 中没有注释信息(第 5 个字段)的用户

[root@localhost ~]# awk -F: '$5 == ""' /etc/passwd
abrt:x:173:173::/etc/abrt:/sbin/nologin
ntp:x:38:38::/etc/ntp:/sbin/nologin
postfix:x:89:89::/var/spool/postfix:/sbin/nologin
tcpdump:x:72:72::/:/sbin/nologin
sys:x:498:1001::/home/sys:/bin/bash
natasha:x:1006:1007::/home/natasha:/bin/bash
harry:x:1007:1008::/home/harry:/bin/bash
sarah:x:497:497::/home/sarah:/bin/nologin

实例11:使用取反(!)运算符打印奇数行

1
2
3
4
5
6
[root@localhost ~]# seq 10 | awk 'i=!i'
1
3
5
7
9

实例12:打印偶数行

1
2
3
4
5
6
[root@localhost ~]# seq 10 | awk -v i=1 'i=!i'
2
4
6
8
10

 

六、正则表达式操作符

3e41ce844b1e7f67.png

实例1:

[root@localhost ~]# cat items.txt 
101,HD Camcorder,Video,210,10
102,Refrigerator,Appliance,850,2
103,MP3 Player,Audio,270,15
104,Tennis Racket,Sports,190,20
105,Laser Printer,Office,475,5
[root@localhost ~]# awk -F, '$2 == "Tennis"' items.txt  #精确匹配
[root@localhost ~]# awk -F, '$2 ~ "Tennis"' items.txt   #模糊匹配
104,Tennis Racket,Sports,190,20

实例2:

[root@localhost ~]# awk -F, '$2 !~ "Tennis"' items.txt  #不匹配
101,HD Camcorder,Video,210,10
102,Refrigerator,Appliance,850,2
103,MP3 Player,Audio,270,15
105,Laser Printer,Office,475,5

实例3:打印 shell 为/bin/bash 的用户的总数,如果最后一个字段包含”/bin/bash”,则变量n 增加 1

[root@localhost ~]# grep -c '/bin/bash' /etc/passwd                                     
9
[root@localhost ~]# awk -F: '$NF ~ /\/bin\/bash/ { n++ } END{ print n}' /etc/passwd
9

 

补充说明:

awk PATTERN模式的其他形式:

  1. empy:空模式,匹配所有行

  2. 关系表达式,表达式结果非0为真,则执行后面body中语句;0则为假,不执行。例如

1
awk -F: '$3>=500{print $1,$3} ' /etc/passwd

  3.行范围,类似sed或vim中的地址定界:

1
/start pattern/,/end pattern/

注意:不支持直接给出数字格式

 

实例:

1
2
3
4
5
6
7
8
9
10
[root@localhost ~]# awk '/^root/,/^mail/{print $0}' /etc/passwd   
root:x:0:0:young,geek,010110110,0101101101:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin

本文永久更新链接地址http://www.linuxidc.com/Linux/2017-02/140318.htm

linux
相关资讯       Linux文本处理  gawk变量 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数

       

评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款