2021-05-12 14:32:11
AWK簡單使用方法
2020-06-16 16:41:27
1. 命令格式
gawk [OPTIONS] 'program' FILES....
program:'PATTERN{ACTION}'
一條awk命令中,PATTERN和ACTION,至少存在一個才可執行;
缺少PATTERN,則對輸入行內容全部執行ACTION;
缺少ACTION,則所有匹配上PATTERN的輸入行都會被輸出;
在awk中使用分號“;”來分割語句;
2. awk的執行過程
awk讀取一行,進行模式匹配,匹配了就執行相應的動作,沒有匹配就忽略,讀取下一行,重複此動作.
3. 內建變數
FS:輸入檔案的field分隔符,預設是空白字元;
OFS:輸出檔案的field分隔符,預設是空白字元;
RS:輸入檔案record分隔符,預設是n;
ORS:輸入檔案record分隔符,預設是n;
NF:每行的field數量,{print NF}表示顯示當前行的field數量,{print $NF}表示顯示當前行的最後一個field;
NR:record數,對所有輸入行進行統一排序;
FNR:record數,對每個檔案的輸入行進行分別排序;
FILENAME:輸入檔案的名字;
ARGC:命令列中的引數個數;
ARGV:陣列,可以將當前命令列中的引數分別加入到ARGV這個陣列中,從0開始;
$1、$2、$3...$n:代表當前行中對應的field
4. 常用OPTION
-F:指定輸入分隔符;
-v:指定awk的變數;像FS、OSF、RS、ORS這些變數,就可以使用-v進行重新賦值;
5. 雙引號的作用
定義一個變數superuser的值為root,但是列印的時候,發現列印出了一個空行,並沒有實際內容
[root@CentOS7 ~]# awk 'BEGIN{superuser=root;print superuser}'
空行......
這是因為只有加上了雙引號才會被awk認為是字串,否則會被認為是變數。在上面這個例子中,想要為superuser賦值的是root字串,但是因為沒有加上雙引號,被awk認為root也是一個變數,但是awk中又不存在這個變數,所以最終為superuser的變數內容就是空。
所以在awk中定義變數應該是這種情況:
[root@centos7 ~]# awk 'BEGIN{superuser="root";print superuser}'
root
使用-v引數就沒有上面的限制
[root@centos7 ~]# awk -v superuser=root 'BEGIN{print superuser}'
root
6. ACTION
6.1 printf命令:按照指定的FORMAT進行格式化輸出;
格式化輸出:printf FORMAT, item1, item2, ...
FORMAT:FORMAT是一個字串, 它包含按字面列印的文字, 中間散布著格式說明符, 格式說明符用於說明如何列印值. 一個格式說明符是一個%, 後面跟著幾個字元, 這些字元控制一個value 的輸出格式. 第一個格式說明符說明item1 的輸出格式, 第二個格式說明符說明item2 的輸出格式, 依次類推. 於是, 格式說明符的數量應該和被列印的item 一樣多;
printf不會自動產生換行符,必須手動建立;
格式符
%s:顯示字串;
%i,%d:顯示十進位制整數;
修飾符
#[.#]:第一個#控制顯示的寬度,第二個#表示小數點後的精度;
例如:%3.1f
-減號:左對齊(不加減號,預設為右對齊);
+加號:顯示數值的符號;
範例
例如:使用printf列印/etc/passwd中的$1和$3
[Allen@centos7 ~]$ head /etc/passwd | awk -F: '{printf "Username: %-12sUID: %-8in",$1,$3}'
Username: root UID: 0
Username: bin UID: 1
Username: daemon UID: 2
Username: adm UID: 3
Username: lp UID: 4
Username: sync UID: 5
Username: shutdown UID: 6
Username: halt UID: 7
Username: mail UID: 8
Username: operator UID: 11
6.2 if-else
語法:'if(condition){statements}[else{statements}]'
使用場景:對awk取得的整行或某個欄位做條件判斷;
範例
例如:當$3大於等於1000時,列印$1;
[Allen@centos7 ~]$ awk -F: '{if($3>=1000) printf "%sn",$1}' /etc/passwd
Allen
logstash
例如:當$3大於等於1000時,列印為CommonUser: $1;否則列印為Systemuser: $1;
[Allen@centos7 ~]$ awk -F: '{if($3>=1000) {printf "CommonUser: %-15sn",$1} else {printf "SystemUser: %sn",$1}}' /etc/passwd | head
SystemUser: root
SystemUser: bin
SystemUser: daemon
SystemUser: adm
SystemUser: lp
SystemUser: sync
SystemUser: shutdown
SystemUser: halt
SystemUser: mail
SystemUser: operator
6.3 while
語法:while(condition){statements}
使用場景:對一行內的多個欄位逐一進行類似處理時使用;或對陣列中的各元素逐一處理時使用;
範例
例如:以空格開頭0次或多次,後跟linux16的行,以空格為分隔符,顯示每行中各欄位的長度;
[Allen@centos7 ~]$ sudo awk '/^[[:space:]]*linux16/{i=1;while(i<=NF) {printf "%-55s%in",$i,length($i); i++}}' /boot/grub2/grub.cfg
linux16 7
/vmlinuz-4.18.14-1.el7 22
root=UUID=2073d1d0-1eab-4a58-900e-b9bfd178278f 46
ro 2
rhgb 4
quiet 5
linux16 7
/vmlinuz-3.10.0-693.el7.x86_64 30
root=UUID=2073d1d0-1eab-4a58-900e-b9bfd178278f 46
ro 2
rhgb 4
quiet 5
例如:以空格開頭0次或多次,後跟linux16的行,以空格為分隔符,只顯示每行中欄位的長度>=7的欄位;
[Allen@centos7 ~]$ sudo awk '/^[[:space:]]*linux16/{i=1;while(i<=NF) {if(length($i)>=7) {printf "%-55s%in",$i,length($i)}; i++}}' /boot/grub2/grub.cfg
linux16 7
/vmlinuz-4.18.14-1.el7 22
root=UUID=2073d1d0-1eab-4a58-900e-b9bfd178278f 46
linux16 7
/vmlinuz-3.10.0-693.el7.x86_64 30
root=UUID=2073d1d0-1eab-4a58-900e-b9bfd178278f 46
6.4 for
語法:for(expr1;expr2;expr3) statement
特殊用法:for(var in arry) statements ##用於遍歷陣列中的元素
範例
例如:以空格開頭0次或多次,後跟linux16的行,以空格為分隔符,顯示每行中各欄位的長度;
[Allen@centos7 ~]$ sudo awk '/^[[:space:]]*linux16/{for(i=1;i<=NF;i++) printf "%-55s%in",$i,length($i)}' /etc/grub2.cfg
linux16 7
/vmlinuz-4.18.14-1.el7 22
root=UUID=2073d1d0-1eab-4a58-900e-b9bfd178278f 46
ro 2
rhgb 4
quiet 5
linux16 7
/vmlinuz-3.10.0-693.el7.x86_64 30
root=UUID=2073d1d0-1eab-4a58-900e-b9bfd178278f 46
ro 2
rhgb 4
quiet 5
7. 描述awk函數範例(至少3例)
length([s]):統計s的字元數量;
sub(r,s):將當前行中最左邊第一個能被r匹配的內容,替換成s;
sub(r,s,t):將t中最左邊第一個能被r匹配的內容,替換成s;
gsub(r,s):將當前行中能被r匹配的內容,全部替換成s;
gsub(r,s,t ):將t中能被r匹配的內容,全部替換成s;
split(s,a):將s分割,然後分別加入到陣列a中(awk命令中沒有指定FS則使用預設的空格做為分隔符);
split(s,a,fs):使用fs將s分割,然後分別加入到陣列a中;
sprintf(format,expr1,expr2,exprn):返回一個字串(不列印),這個字串按指定的format格式化expr1..exprn
genline:讀取下一行,重新設定NF、NR、FNR;
範例
範例1:length函數
[root@centos7 ~]# awk 'BEGIN{superuser="root";print length(superuser)}'
4
範例2:sub和gsub函數
[root@centos7 ~]# echo "hello World" | awk '{sub("l",1);print $0}'
he1lo World
[root@centos7 ~]# echo "hello World" | awk '{sub("l",1,$1);print $0}'
he1lo World
[root@centos7 ~]# echo "hello World" | awk '{gsub("l",1);print $0}'
he11o Wor1d
[root@centos7 ~]# echo "hello World" | awk '{gsub("l",1,$1);print $0}'
he11o World
範例3:split函數
陣列下標從1開始
[root@centos7 ~]# awk -F/ 'BEGIN{i="China/America/Britain";split(i,countrys);for(c=1;c<=3;c++)print countrys[c]}'
China
America
Britain
[root@centos7 ~]# awk 'BEGIN{i="China/America/Britain";split(i,countrys,"/");for(c=1;c<=3;c++)print countrys[c]}'
China
America
Britain
範例4:sprintf函數
[root@centos7 ~]# awk -F: 'NR>=1&&NR<=5{x=sprintf("%-10s%-5d",$1,$3);print x}' /etc/passwd
root 0
bin 1
daemon 2
adm 3
lp 4
範例5:getline函數
列印出從1到10之間的偶數
awk首先讀取到了第一行,就是1,然後getline,就得到了1下面的第二行,就是2,因為getline之後,awk會改變對應的NF,NR,FNR和$0等內部變數,所以此時的$0的值就不再是1,而是2了,然後將它列印出來。以此類推,就可以得到下面的結果。
[Allen@centos7 ~]$ seq 10 | awk '{getline; print $0}'
2
4
6
8
10
列印出從1到10之間的奇數
因為getline在print $0之後,此時的$0仍然是第一行。然後getline,$0變成了下一行2。依次類推,就列印出了奇數行。
[Allen@centos7 ~]$ seq 10 | awk '{print $0; getline}'
1
3
5
7
9
相關文章