2021-05-12 14:32:11
Linux文字處理小貼士
2020-06-16 16:39:00
作為一名 Linux 研發人員,幾乎每天都要面對文字處理場景。 因此 掌握文字處理套路 並 熟練運用文字處理命令 ,對於 提升工作效率 意義重大。
本文以一個實戰例子拋磚引玉,介紹如何運用 grep 、 awk 、 sed 、 cut 等命令進行文字處理, 以 快速 完成原本很繁瑣的操作。
背景
筆者開發機上有很多 Docker 映象,現在需要刪除名為 none
的那些:
$ docker images
REPOSITORY TAG IMAGE ID CREATED SIZE
api-adapter v1 e9bc8e28af2a 3 hours ago 7.67MB
<none> <none> f0fa889be9e8 2 days ago 956MB
<none> <none> 257954316455 2 days ago 956MB
<none> <none> 99739acbfe7a 2 days ago 956MB
<none> <none> 52b10754a70c 2 days ago 956MB
<none> <none> 86878eefdd39 2 days ago 956MB
golang 1.10 0a19f4d16598 12 days ago 729MB
Python 3 1e80caffd59e 12 days ago 923MB
如何操作呢?莫非手工一個個刪除麼?
$ docker image rm f0fa889be9e8
試想,如果有上百個這樣的映象待刪,要搞到何年何月!但如何改進呢?
文字過濾
考慮先把名字為 none
的映象從結果中過濾出來, grep 命令即可搞定:
$ docker images | grep none
<none> <none> f0fa889be9e8 2 days ago 956MB
<none> <none> 257954316455 2 days ago 956MB
<none> <none> 99739acbfe7a 2 days ago 956MB
<none> <none> 52b10754a70c 2 days ago 956MB
<none> <none> 86878eefdd39 2 days ago 956MB
欄位提取
接著,將容器 ID 一列提取出來,這對 awk 來說簡直是小兒科:
$ docker images | grep none | awk '{print $3}'
f0fa889be9e8
257954316455
99739acbfe7a
52b10754a70c
86878eefdd39
當然了,通過 cut 命令進行 欄位切分 也可以得到相同的結果。 由於 cut 只能按單個字元進行切分,而原文字中的空格為多個,因此需要先進行 文字替換 。
文字替換
文字替換是 sed 命令擅長的事,下面將一個或多個空格替換成一個:
$ docker images | grep none | sed 's/ */ /g'
<none> <none> f0fa889be9e8 2 days ago 956MB
<none> <none> 257954316455 2 days ago 956MB
<none> <none> 99739acbfe7a 2 days ago 956MB
<none> <none> 52b10754a70c 2 days ago 956MB
<none> <none> 86878eefdd39 2 days ago 956MB
文字切分
接下來,使用 cut 命令對結果進行進一步切分並取出第三個欄位:
$ docker images | grep none | sed 's/ */ /g' | cut -d ' ' -f 3
f0fa889be9e8
257954316455
99739acbfe7a
52b10754a70c
86878eefdd39
不錯,我們得到與運用 awk 命令相同的結果。
批次刪除
接下來,通過 xargs 批次刪除映象:
$ docker images | grep none | awk '{print $3}' | xargs docker image rm
Deleted: sha256:f0fa889be9e8f8369353a32e8cec17e9333cbeb581de5f78bf6875917d971bc9
Deleted: sha256:d301d0546b29b7daa55d29f29d9253664870fd83465aefe8b92ff6a7048d5612
...
在這個例子中, xargs 最終將執行以下命令:
$ docker image rm f0fa889be9e8 257954316455 99739acbfe7a 52b10754a70c 86878eefdd39
看到沒有,所有不想要的映象都刪除乾淨了,而且只需要進行一次操作:
$ docker images
REPOSITORY TAG IMAGE ID CREATED SIZE
api-adapter v1 e9bc8e28af2a 3 hours ago 7.67MB
golang 1.10 0a19f4d16598 12 days ago 729MB
python 3 1e80caffd59e 12 days ago 923MB
下面這個操作也是等價的:
$ docker images | grep none | sed 's/ */ /g' | cut -d ' ' -f 3 | xargs docker image rm
相關文章