首頁 > 軟體

Linux教學:結合awk列舉大於指定容量大小所有檔案目錄

2020-06-16 17:55:28

業務背景

/home/pms目錄是工作目錄,現在該目錄佔用硬碟空間過大,需要清理,現在需要列舉該目錄中所有大於200MB的子檔案目錄,以及該子檔案目錄的佔用空間

指令碼實現

du -h --max-depth=10 /home/pms/* | awk '{ if($1 ~ /M/){split($1, arr, "M")}; if(($1 ~ /G/) || ($1 ~ /M/ && arr[1]>200)) {printf "%-10s %sn", $1, $2} }' | sort -n -r

其中

du -h --max-depth=10 /home/pms/*

結果如下

$ du -h --max-depth=10 /home/pms/*
0       /home/pms/addressCountMap
12K     /home/pms/bigDataEngine/conf
1.7M    /home/pms/bigDataEngine/analysis/warning
33M     /home/pms/bigDataEngine/analysis/log
...

下面這個awk語句,作用是判斷第一個引數,進行字串匹配,如果是M的話,按字元M進行擷取

if($1 ~ /M/){split($1, arr, "M")};

下面這個awk語句,作用是判斷第一個引數,進行字串匹配:

  • M,判斷容量是否大於200MB,是則直接輸出引數1和引數2

  • G,直接輸出引數1和引數2

if(($1 ~ /G/) || ($1 ~ /M/ && arr[1]>200)) {printf "%-10s %sn", $1, $2}

輸出結果

$ du -h --max-depth=10 /home/pms/* | awk '{ if($1 ~ /M/){split($1, arr, "M")}; if(($1 ~ /G/) || ($1 ~ /M/ && arr[1]>200)) {printf "%-10s %sn", $1, $2} }' | sort -n -r 
1018M      /home/pms/recsys/algorithm/schedule/project/mixproduct
948M       /home/pms/recsys/algorithm/schedule/project/contentbasedrelatedproduct
940M       /home/pms/recsys/algorithm/schedule/project/view_after_viewing/cf
922M       /home/pms/new_product_import
913M       /home/pms/db_engine
903M       /home/pms/recsys/algorithm/schedule/project/campus
862M       /home/pms/recsys/algorithm/schedule/project/company/user

awk跳脫序列與算術操作符  http://www.linuxidc.com/Linux/2015-06/118886.htm

AWK簡介及使用範例 http://www.linuxidc.com/Linux/2013-12/93519.htm

AWK 簡介和例子 http://www.linuxidc.com/Linux/2012-12/75441.htm

Shell指令碼之AWK文字編輯器語法 http://www.linuxidc.com/Linux/2013-11/92787.htm

正規表示式中AWK的學習和使用 http://www.linuxidc.com/Linux/2013-10/91892.htm

文字資料處理之AWK 圖解 http://www.linuxidc.com/Linux/2013-09/89589.htm

如何在Linux中使用awk命令 http://www.linuxidc.com/Linux/2014-10/107542.htm

文字分析工具-awk  http://www.linuxidc.com/Linux/2014-12/110939.htm

本文永久更新連結地址http://www.linuxidc.com/Linux/2015-08/121540.htm


IT145.com E-mail:sddin#qq.com