首頁 > 軟體

Linux之grep及正規表示式

2020-06-16 17:09:58

grep簡介

  grep 是一種強大的文字搜尋工具,它能使用正規表示式搜尋文字,並把匹配的行列印出來。通常grep有三種版本grep、egrep(等同於grep -E)和fgrep。egrep為擴充套件的grep,fgrep則為快速grep(固定的字串來對文字進行搜尋,不支援正規表示式的參照但是查詢極為快速)。grep是Linux文字處理三劍客之一。

grep使用方式

  使用方式:grep [OPTIONS] PATTERN [FILE...]

  grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]

  常用選項:

  --color=auto:對匹配到的文字著色後進行高亮顯示;

   -i:忽略字元的大小寫

  -o:僅顯示匹配到的字串

  -v:顯示不能被模式匹配到的行

  -E:支援使用擴充套件的正規表示式

  -q:靜默模式,即不輸出任何資訊

  -A #:顯示被模式匹配的行及其後#行

  -B #:顯示被模式匹配的行及其前#行

  -C #:顯示被模式匹配的行及其前後各#行

  :使用grep匹配時需使用雙引號引起來(單引號為強參照),防止被系統誤認為引數或者特殊命令而報錯。

擴充套件grep使用方式

  使用方式:egrep [OPTIONS] PATTERN [FILE...] 

  grep -E [OPTIONS] PATTERN [FILE...]

  -i:忽略字元的大小寫
  -o:僅顯示匹配到的字串本身
  -v:顯示不被模式匹配到的行
  -q:靜默模式,即不輸出任何資訊
  -A #:顯示被模式匹配的行及其後#行
  -B #:顯示被模式匹配的行及其前#行
  -C #:顯示被模式匹配的行及其前後各#行
  -G:支援基本正規表示式

grep正規表示式元字元

  ‘^‘: 錨定行首

  ‘$’: 錨定行尾 

  ‘.‘: 匹配任一一個字元

  ‘*’: 匹配零個或多個先前字元 

  ‘?‘:匹配其前面的字元0次或者1次;

  ‘+’:匹配其前面的字元1次或者多次;

  ‘{m}‘:匹配其前面的字元m次(為跳脫字元)

  ‘{m,n}’:匹配其前面的字元至少m次,至多n次

  ‘[]‘: 匹配一個指定範圍內的字元 | ‘[^]’匹配指定範圍外的任意單個字元

  ‘<‘或‘b’:錨定詞首,‘>’或‘b’:錨定詞尾(可用<PATTERN>:匹配完整單詞)

  ‘()’:將多個字元當做一個整體進行處理

  後向參照:參照前面的分組括號中的模式所匹配到的字元

  分組括號中的模式匹配到的內容或被正規表示式引擎自動記錄於內部的變數中:

  1:模式從左側起,第一個左括號及與之匹配的右括號之間模式匹配到的內容

  2:模式從左側起,第二個左括號及與之匹配的右括號之間模式匹配到的內容...

  擴充套件正規表示式與正規表示式略有不同:

  '[]':依舊匹配指定範圍內的任意單個字元;但是有很多特殊匹配方式。

    [:digit:] 匹配任意單個數位

    [:lower:] 匹配任意單個小寫字母               

    [:upper:] 匹配任意單個大寫字母

    [:alpha:] 匹配任意單個字母

    [:alnum:] 匹配任意單個字母或數位

    [:punct:] 匹配任意單個符號

    [:space:] 匹配單個空格

  一些地方取消了跳脫字元的使用:

  ‘?‘:匹配其前面的字元0次或者1次;

  ‘+’:匹配其前面的字元1次或者多次;

  ‘{m}‘:匹配其前面的字元m次(為跳脫字元)

  ‘{m,n}’:匹配其前面的字元至少m次,至多n次

  ():將一個或多個字元捆綁在一起,當做一個整體進行處理,反向參照照常使用。

  ‘|’:或(:‘C|cat’為C與cat,‘(C|c)at才是Cat與cat’)

練習題:

  1、列出當前系統上所有已經登入的使用者的使用者名稱,注意:同一個使用者登入多次,則只顯示一次

[root@localhost ~]# who | cut -d' ' -f1|uniq
root

  2、取出最後登入到當前系統的使用者的相關資訊

[root@localhost ~]# id `last | head -1 | cut -d' ' -f1`
uid=0(root) gid=0(root) groups=0(root)

  3.取出當前系統上被使用者當做其預設shell最多的那個shell

[root@localhost ~]# cut -d':' -f7 /etc/passwd|uniq -c|sort -n|tail -1|cut -d' ' -f7
/sbin/nologin

  4.將/etc/passd中的第三個欄位設定最大的後10個使用者的資訊全部改為大寫儲存至/tmp/maxuser.txt檔案中

[root@localhost ~]# sort -t':' -k3 -n /etc/passwd|tail -10|tr 'a-z' 'A-Z' >/tmp/maxusers.txt
[root@localhost ~]# cat /tmp/maxusers.txt 
NOBODY:X:99:99:NOBODY:/:/SBIN/NOLOGIN
SYSTEMD-NETWORK:X:192:192:SYSTEMD NETWORK MANAGEMENT:/:/SBIN/NOLOGIN
NGINX:X:996:994:NGINX WEB SERVER:/VAR/LIB/NGINX:/SBIN/NOLOGIN
CHRONY:X:997:995::/VAR/LIB/CHRONY:/SBIN/NOLOGIN
POLKITD:X:998:996:USER FOR POLKITD:/:/SBIN/NOLOGIN
SYSTEMD-BUS-PROXY:X:999:997:SYSTEMD BUS PROXY:/:/SBIN/NOLOGIN
DINGJIE:X:1000:1000:DINGJIE:/HOME/DINGJIE:/BIN/BASH
JEFF:X:1001:1024:WOSHIDASHUAIBI:/HOME/JEFF:/BIN/BASH
EGON:X:1002:1002::/HOME/EGON:/BIN/BASH
NFSNOBODY:X:65534:65534:ANONYMOUS NFS USER:/VAR/LIB/NFS:/SBIN/NOLOGIN

  5.取出當前主機的IP地址

[root@localhost ~]# ifconfig | egrep "inet.*broadcast.*"|cut -d' ' -f10
192.168.0.133

  6.列出/etc目錄下所有已.conf結尾的檔案的檔名,並將其名字轉換為大寫後儲存至/tmp/etc.conf檔案中

[root@localhost ~]# find /etc -name '*.conf' | egrep -o "[^/]*(.conf)$"|tr 'a-z' 'A-Z' >/tmp/etc.conf
[root@localhost ~]# cat /tmp/etc.conf 
RESOLV.CONF
CA-LEGACY.CONF
FASTESTMIRROR.CONF
LANGPACKS.CONF
SYSTEMD.CONF
VERSION-GROUPS.CONF
LVM.CONF
LVMLOCAL.CONF
ASOUND.CONF
LDAP.CONF
MLX4.CONF
RDMA.CONF
SMTPD.CONF

  7.顯示/var目錄下一級子目錄或檔案的總數

[root@localhost ~]# ls /var | wc -l
21

  8.取出/etc/group第三個欄位數值最小的10個組的名字

[root@localhost ~]# sort -t: -k3 -n /etc/group|head -10 |cut -d':' -f1
root
bin
daemon
sys
adm
tty
disk
lp
mem
kmem

  9.將/etc/fstab和/etc/issue檔案的內容合併為同一個內容後儲存至/tmp/etc.test檔案中

[root@localhost ~]# cat /etc/fstab /etc/issue > /tmp/etc.test
[root@localhost ~]# cat /tmp/etc.test 

#
# /etc/fstab
# Created by anaconda on Sat May 13 10:12:58 2017
#
# Accessible filesystems, by reference, are maintained under '/dev/disk'
# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
#
/dev/mapper/cl-root     /                       xfs     defaults        0 0
UUID=2789d01a-4e2b-47a5-9c3c-537641648663 /boot                   xfs     defaults        0 0
/dev/mapper/cl-swap     swap                    swap    defaults        0 0
S
Kernel r on an m

  對於正規表示式的使用需要多聯絡加強記憶,否則是用不好正規表示式的,在學習過程中切記多寫多背。

Linux命令-檔案文字操作grep  http://www.linuxidc.com/Linux/2015-12/126259.htm

grep正規表示式 http://www.linuxidc.com/Linux/2015-09/123035.htm

Linux中正規表示式與檔案格式化處理命令(awk/grep/sed) http://www.linuxidc.com/Linux/2013-03/81018.htm

Linux基礎之grep和正規表示式 http://www.linuxidc.com/Linux/2016-10/136250.htm

14 個 grep 命令的例子 http://www.linuxidc.com/Linux/2015-05/117626.htm

Linux文字處理工具grep和正規表示式及egrep與grep區別  http://www.linuxidc.com/Linux/2016-08/134046.htm

Linux基礎之-正規表示式(grep,sed,awk)  http://www.linuxidc.com/Linux/2017-05/144221.htm

Linux文字處理工具及grep  http://www.linuxidc.com/Linux/2017-03/142277.htm 

grep 命令系列:如何在 UNIX 中根據檔案內容查詢檔案 http://www.linuxidc.com/Linux/2016-01/128017.htm

本文永久更新連結地址http://www.linuxidc.com/Linux/2017-07/145850.htm


IT145.com E-mail:sddin#qq.com