三分鐘教你輕鬆掌握 grep 命令中的正規表示式

2020-06-16 17:47:00

如何在 Linux 系統和類 Unix 的作業系統中使用帶正規表示式的 grep 命令呢？

Linux 系統自帶了支援拓展正規表示式的 GNU 版本 grep 工具。所有的 Linux 系統中預設安裝的都是 GNU 版 grep 。grep 命令被用來檢索一台伺服器或工作站上任何位置的文字資訊。

一、快速了解正規表示式

1、如何匹配你要查詢的內容？

正規表示式只不過是每個輸入行匹配的模式。模式是一個字元序列。下面都是範例：

例如：“^w1”、“w1|w2”、“[^ ]”。

在 ‘/etc/passswd’ 中檢索 ‘vivek’ 。
grep vivek /etc/passwd

輸出結果案例：
vivek:x:1000:1000:Vivek Gite,,,:/home/vivek:/bin/bash
vivekgite:x:1001:1001::/home/vivekgite:/bin/sh
gitevivek:x:1002:1002::/home/gitevivek:/bin/sh

在任何情況下都搜尋 ‘vivek’ (即不區分大小)：
grep -i -w vivek /etc/passwd

不區分大小寫地檢索 ‘vivek’ 和 ‘raj’ ：
grep -E -i -w 'vivek|raj' /etc/passwd

在最後一個例子中，使用了擴充套件正規表示式的模式。

固定檢索內容的位置：
你可以使用 ^ 和 $ 符號強制一個正規表示式分別匹配一行的開始或結束的位置。下面的範例顯示以 ‘vivek’ 開頭的文字。
grep ^vivek /etc/passwd

輸出結果範例：
vivek:x:1000:1000:Vivek Gite,,,:/home/vivek:/bin/bash
vivekgite:x:1001:1001::/home/vivekgite:/bin/sh

你可以只顯示以 vivek 開頭的文字行。舉例說就是不顯示 vivekgite , vivekg 這樣單詞開頭的。
grep -w ^vivek /etc/passwd

檢索以 ‘foo’ 結尾的文字格式：
grep 'foo$' FILENAME

你還可以用下面這樣的方式搜尋空白行：
grep '^$' FILENAME

2、如何匹配具體字元？

匹配 ‘Vivek’ 或 ‘vivek’ ：
grep '[vV]ivek' FILENAME

或者可以這樣：
grep '[vV][iI][Vv][Ee][kK]' FILENAME

你可以匹配數位（例如匹配 vivek1 或 Vivek2 ）：
grep -w '[vV]ivek[0-9]' FILENAME

你可以匹配兩位數（例如匹配 foo11 ， foo12 ）：
grep 'foo[0-9][0-9]' FILENAME

不僅僅是數位，你可以匹配字母：
grep '[A-Za-z]' FILENAME

顯示所有包含 “w” 或 “n” 字母的文字行：
grep [wn] FILENAME

在括號內的表示式中，在“ [: ”和“ :] ”中所附的字元類的名稱：代表屬於該類的所有字元的列表。標準字元類名稱：
?[:alnum:] – 字母數位字元。
?[:alpha:] – 字母順序
?[:blank:] – 空格和製表符。
?[:digit:] – 數位： ‘0 1 2 3 4 5 6 7 8 9’。
?[:lower:] – 小寫字母：‘a b c d e f ‘。
?[:space:] – 特殊字元：製表符，換行符，垂直製表符、換頁，回車，和空間。
?[:upper:] – 大寫字母：‘A B C D E F G H I J K L M N O P Q R S T U V W X Y Z’。

在下面這個例子中，匹配所有大寫字母：
grep '[:upper:]' FILENAME

3、如何使用萬用字元？

你可以用 “.” 來代替單個字元。在下面的例子中，查詢了所有以字母 “b” 開頭、字母 “t” 結尾的三個字元的單詞。
grep '<b.t>' FILENAME

在上面的例子中，
?< 在單詞的開始位置匹配空格字串
?> 在單詞的結尾匹配空格字串

檢索並輸出所有兩個字母的結果：
grep '^..$' FILENAME

檢索並顯示所有以 ‘.’ 和數位開頭的結果：
grep '^.[0-9]' FILENAME

跳脫字元’.’
下面的正規表示式查詢 IP 地址 192.168.1.254 將不能獲得預期的結果：
grep '192.168.1.254' /etc/hosts

其中三個點都需要被跳脫：
grep '192.168.1.254' /etc/hosts

以下範例將只匹配一個地址：
egrep '[[:digit:]]{1,3}.[[:digit:]]{1,3}.[[:digit:]]{1,3}.[[:digit:]]{1,3}' FILENAME

以下將不分大小寫地匹配單詞 Linux 或 Unix ：
egrep -i '^(linux|unix)' FILENAME

二、深入探索 grep 高階查詢模式

1、如何檢索一個具有以 ‘-‘ 開頭的的模式？

使用 -e 選項搜尋所有匹配 ‘–test–‘ 的結果。grep 會嘗試把 ‘–test–‘ 作為一個選項解析：
grep -e '--test--' FILENAME

2、如何在grep中使用 OR 的邏輯運算？
grep -E 'word1|word2' FILENAME
### OR ###
egrep 'word1|word2' FILENAME

或者可以這樣做
grep 'word1|word2' FILENAME

3、如何在grep中使用 AND 的邏輯運算？

按照下面的語法顯示所有包含了單詞 ‘word1′ 和 ‘word2′ 的結果：
grep 'word1' FILENAME | grep 'word2'

或者可以這樣：
grep 'foo.*bar|word3.*word4' FILENAME

4、如何測試序列？

你可以使用下面的語法測試一個字元在序列中的重複的次數：
{N}
{N,}
{min,max}

匹配包含兩個字母 v 的字串結果：
egrep "v{2}" FILENAME

下面的例子中將檢索檔案內包含 “col” 和 “cool” 的字串結果：
egrep 'co{1,2}l' FILENAME

下面的例子中將匹配至少含有3個字母 c 的結果：
egrep 'c{3,}' FILENAME

下面的範例將匹配 “91-1234567890″ 格式的手機號碼（即 “兩位數位-十位數位”）
grep "[[:digit:]]{2}[ -]?[[:digit:]]{10}" FILENAME

5、如何使 grep 的輸出結果高亮標註？

使用下面例子的語法：
grep --color regex FILENAME

6、如何使 grep 的輸出只顯示匹配的部分而不是整行？

使用下面例子的語法：
grep -o regex FILENAME

三、正規表示式操作符總結

正規表示式操作符	含義
.	匹配任何單個字元。
?	匹配前一個字元0次或1次。
*	匹配前一個字元≥0次。
+	匹配前一個字元≥1次。
{N}	匹配前一個字元N次。
{N,}	匹配前一個字元≥m次。
{N,M}	匹配前一個字元 N 到 M次。
–	如果在列表中的某個列表或某個範圍內的結束點，表示該範圍。
^	開始標記，表示在開始位置匹配一個空字串。也表示不在列表的範圍內的字元。
$	結束標記。匹配一個空的字串。
b	單詞鎖定符。在一個單詞的邊緣位置匹配空字串。
B	在一個單詞的非邊緣位置匹配空字串。
<	匹配單詞開始的空字串。
>	匹配單詞結尾的空字串。

四、關於 grep 和 egrep

egrep 即 grep -E ，它把模式作為一個擴充套件的正規表示式解釋。grep 幫助文件中這樣定義：

 In basic regular expressions the meta-characters ?, +, {, |, (, and ) lose their special meaning; instead use the backslashed versions ?, +, {,
       |, (, and ).
       Traditional egrep did not support the { meta-character, and some egrep implementations support { instead, so portable scripts should avoid  {  in
       grep -E patterns and should use [{] to match a literal {.
       GNU grep -E attempts to support traditional usage by assuming that { is not special if it would be the start of an invalid interval specification.
       For example, the command grep -E '{1' searches for the two-character string {1 instead of reporting a syntax  error  in  the  regular  expression.
       POSIX.2 allows this behavior as an extension, but portable scripts should avoid it.

參考文獻：

grep and regex 的幫助文件
grep 的 info幫助文件

grep使用簡明及正規表示式 http://www.linuxidc.com/Linux/2013-08/88534.htm

正規表示式的用法 http://www.linuxidc.com/Linux/2013-03/81897.htm

正規表示式之零寬斷言 http://www.linuxidc.com/Linux/2013-03/81897.htm

Linux命令-檔案文字操作grep http://www.linuxidc.com/Linux/2015-12/126259.htm

grep正規表示式 http://www.linuxidc.com/Linux/2015-09/123035.htm

Linux中正規表示式與檔案格式化處理命令(awk/grep/sed) http://www.linuxidc.com/Linux/2013-03/81018.htm

原文連結：http://www.cyberciti.biz/faq/grep-regular-expressions/
本文連結：http://www.linuxstory.org/grep-regular-expressions/

本文永久更新連結地址：http://www.linuxidc.com/Linux/2016-01/127464.htm

三分鐘教你輕鬆掌握 grep 命令中的正規表示式

四、關於 grep 和 egrep

參考文獻：

熱門文章