首頁 > 軟體

Linux文字處理小貼士

2020-06-16 16:39:00

作為一名 Linux 研發人員,幾乎每天都要面對文字處理場景。 因此 掌握文字處理套路熟練運用文字處理命令 ,對於 提升工作效率 意義重大。

本文以一個實戰例子拋磚引玉,介紹如何運用 grepawksedcut 等命令進行文字處理, 以 快速 完成原本很繁瑣的操作。

背景

筆者開發機上有很多 Docker 映象,現在需要刪除名為 none 的那些:

$ docker images
REPOSITORY          TAG                 IMAGE ID            CREATED             SIZE
api-adapter         v1                  e9bc8e28af2a        3 hours ago         7.67MB
<none>              <none>              f0fa889be9e8        2 days ago          956MB
<none>              <none>              257954316455        2 days ago          956MB
<none>              <none>              99739acbfe7a        2 days ago          956MB
<none>              <none>              52b10754a70c        2 days ago          956MB
<none>              <none>              86878eefdd39        2 days ago          956MB
golang              1.10                0a19f4d16598        12 days ago         729MB
Python              3                   1e80caffd59e        12 days ago         923MB

如何操作呢?莫非手工一個個刪除麼?

$ docker image rm f0fa889be9e8

試想,如果有上百個這樣的映象待刪,要搞到何年何月!但如何改進呢?

文字過濾

考慮先把名字為 none 的映象從結果中過濾出來, grep 命令即可搞定:

$ docker images | grep none
<none>              <none>              f0fa889be9e8        2 days ago          956MB
<none>              <none>              257954316455        2 days ago          956MB
<none>              <none>              99739acbfe7a        2 days ago          956MB
<none>              <none>              52b10754a70c        2 days ago          956MB
<none>              <none>              86878eefdd39        2 days ago          956MB

欄位提取

接著,將容器 ID 一列提取出來,這對 awk 來說簡直是小兒科:

$ docker images | grep none | awk '{print $3}'
f0fa889be9e8
257954316455
99739acbfe7a
52b10754a70c
86878eefdd39

當然了,通過 cut 命令進行 欄位切分 也可以得到相同的結果。 由於 cut 只能按單個字元進行切分,而原文字中的空格為多個,因此需要先進行 文字替換

文字替換

文字替換是 sed 命令擅長的事,下面將一個或多個空格替換成一個:

$ docker images | grep none | sed 's/  */ /g'
<none> <none> f0fa889be9e8 2 days ago 956MB
<none> <none> 257954316455 2 days ago 956MB
<none> <none> 99739acbfe7a 2 days ago 956MB
<none> <none> 52b10754a70c 2 days ago 956MB
<none> <none> 86878eefdd39 2 days ago 956MB

文字切分

接下來,使用 cut 命令對結果進行進一步切分並取出第三個欄位:

$ docker images | grep none | sed 's/  */ /g' | cut -d ' ' -f 3
f0fa889be9e8
257954316455
99739acbfe7a
52b10754a70c
86878eefdd39

不錯,我們得到與運用 awk 命令相同的結果。

批次刪除

接下來,通過 xargs 批次刪除映象:

$ docker images | grep none | awk '{print $3}' | xargs docker image rm
Deleted: sha256:f0fa889be9e8f8369353a32e8cec17e9333cbeb581de5f78bf6875917d971bc9
Deleted: sha256:d301d0546b29b7daa55d29f29d9253664870fd83465aefe8b92ff6a7048d5612
...

在這個例子中, xargs 最終將執行以下命令:

$ docker image rm f0fa889be9e8 257954316455 99739acbfe7a 52b10754a70c 86878eefdd39

看到沒有,所有不想要的映象都刪除乾淨了,而且只需要進行一次操作:

$ docker images
REPOSITORY          TAG                 IMAGE ID            CREATED             SIZE
api-adapter         v1                  e9bc8e28af2a        3 hours ago         7.67MB
golang              1.10                0a19f4d16598        12 days ago         729MB
python              3                   1e80caffd59e        12 days ago         923MB

下面這個操作也是等價的:

$ docker images | grep none | sed 's/  */ /g' | cut -d ' ' -f 3 | xargs docker image rm

IT145.com E-mail:sddin#qq.com