Linux下過濾文字、實現高效檔案操作的12個實用命令

linuxidc@linuxidc ~ $ head /var/log/auth.log
Jan 2 10:45:01 linuxidc CRON[3383]: pam_unix(cron:session): session opened for user root by (uid=0)
Jan 2 10:45:01 linuxidc CRON[3383]: pam_unix(cron:session): session closed for user root
Jan 2 10:51:34 linuxidc sudo: linuxidc : TTY=unknown ; PWD=/home/linuxidc ; USER=root ; COMMAND=/usr/lib/linuxmint/mintUpdate/checkAPT.py
Jan 2 10:51:34 linuxidc sudo: pam_unix(sudo:session): session opened for user root by (uid=0)
Jan 2 10:51:39 linuxidc sudo: pam_unix(sudo:session): session closed for user root
Jan 2 10:55:01 linuxidc CRON[4099]: pam_unix(cron:session): session opened for user root by (uid=0)
Jan 2 10:55:01 linuxidc CRON[4099]: pam_unix(cron:session): session closed for user root
Jan 2 11:05:01 linuxidc CRON[4138]: pam_unix(cron:session): session opened for user root by (uid=0)
Jan 2 11:05:01 linuxidc CRON[4138]: pam_unix(cron:session): session closed for user root
Jan 2 11:09:01 linuxidc CRON[4146]: pam_unix(cron:session): session opened for user root by (uid=0)
linuxidc@linuxidc ~ $ head -n 5 /var/log/auth.log
Jan 2 10:45:01 linuxidc CRON[3383]: pam_unix(cron:session): session opened for user root by (uid=0)
Jan 2 10:45:01 linuxidc CRON[3383]: pam_unix(cron:session): session closed for user root
Jan 2 10:51:34 linuxidc sudo: linuxidc : TTY=unknown ; PWD=/home/linuxidc ; USER=root ; COMMAND=/usr/lib/linuxmint/mintUpdate/checkAPT.py
Jan 2 10:51:34 linuxidc sudo: pam_unix(sudo:session): session opened for user root by (uid=0)
Jan 2 10:51:39 linuxidc sudo: pam_unix(sudo:session): session closed for user root

5.tail命令

tail輸出檔案的末尾部分(預設情況下是末尾10行)。使用-n num引數選項符，即可指定顯示的行數。

下面這個命令會輸出指定檔案的末尾5行：

linuxidc@linuxidc ~ $ tail -n 5 /var/log/auth.log
Jan 6 13:01:27 linuxidc sshd[1269]: Server listening on 0.0.0.0 port 22.
Jan 6 13:01:27 linuxidc sshd[1269]: Server listening on :: port 22.
Jan 6 13:01:27 linuxidc sshd[1269]: Received SIGHUP; restarting.
Jan 6 13:01:27 linuxidc sshd[1269]: Server listening on 0.0.0.0 port 22.
Jan 6 13:01:27 linuxidc sshd[1269]: Server listening on :: port 22.

此外，tail有一個特殊的選項-f，可用於實時檢視檔案(尤其是紀錄檔檔案)的變化。

下面這個命令讓你能夠密切關注指定檔案的變化：

linuxidc@linuxidc ~ $ tail -f /var/log/auth.log
Jan 6 12:58:01 linuxidc sshd[1269]: Server listening on :: port 22.
Jan 6 12:58:11 linuxidc sshd[1269]: Received SIGHUP; restarting.
Jan 6 12:58:12 linuxidc sshd[1269]: Server listening on 0.0.0.0 port 22.
Jan 6 12:58:12 linuxidc sshd[1269]: Server listening on :: port 22.
Jan 6 13:01:27 linuxidc sshd[1269]: Received SIGHUP; restarting.
Jan 6 13:01:27 linuxidc sshd[1269]: Server listening on 0.0.0.0 port 22.
Jan 6 13:01:27 linuxidc sshd[1269]: Server listening on :: port 22.
Jan 6 13:01:27 linuxidc sshd[1269]: Received SIGHUP; restarting.
Jan 6 13:01:27 linuxidc sshd[1269]: Server listening on 0.0.0.0 port 22.
Jan 6 13:01:27 linuxidc sshd[1269]: Server listening on :: port 22.

參閱tail的參考手冊頁，即可了解完整的用法選項和操作說明：

$ man tail

6.sort命令

sort用於排序文字檔案的行或來自標準輸入的行。

下面是一個名為domains.list的檔案的內容：

linuxidc@linuxidc ~ $ cat domains.list
linuxidc.com
linuxidc.com
news.linuxidc.com
news.linuxidc.com
linuxsay.com
linuxsay.com
windowsmint.com
windowsmint.com

你可以執行簡單的sort命令，排序檔案內容，就像這樣：

linuxidc@linuxidc ~ $ sort domains.list
linuxsay.com
linuxsay.com
news.linuxidc.com
news.linuxidc.com
linuxidc.com
linuxidc.com
windowsmint.com
windowsmint.com

使用sort命令有好多方式，我們編寫了幾篇實用文章來介紹sort命令，如下所示：

Linux中的sort命令 http://www.linuxidc.com/Linux/2016-08/134626.htm

Linux Sort命令的七個有趣範例（二） http://www.linuxidc.com/Linux/2015-05/116997.htm

7.uniq命令

uniq命令用於報告或忽略重複的行，它可以過濾來自標準輸入的行，並將結果寫入到標準輸出。

對輸入流執行sort後，可以用uniq來消除重複的行，如下面這個例子所示。

為了表明某行出現的次數，可使用-c選項，忽視大小寫區別，同時通過加入-i選項來比較：

linuxidc@linuxidc ~ $ cat domains.list
linuxidc.com
linuxidc.com
news.linuxidc.com
news.linuxidc.com
linuxsay.com
linuxsay.com
windowsmint.com
sort domains.list | uniq -c
2 linuxsay.com
2 news.linuxidc.com
2 linuxidc.com
1 windowsmint.com

閱讀uniq的參考手冊頁，可進一步了解用法資訊和標誌：

$ man uniq

8.fmt命令

fmt是簡單的最佳文字格式器，它可以重新格式化指定檔案中的段落，並將結果列印輸出到標準輸出。

下面是從檔案domain-list.txt提取的內容：

1.linuxidc.com 2.news.linuxidc.com 3.linuxsay.com 4.windowsmint.com

要將上述內容重新格式化成標準列表，執行下面這個命令，-w引數選項符用來定義最大行寬：

linuxidc@linuxidc ~ $ cat domain-list.txt
1.linuxidc.com 2.news.linuxidc.com 3.linuxsay.com 4.windowsmint.com
linuxidc@linuxidc ~ $ fmt -w 1 domain-list.txt
1.linuxidc.com
2.news.linuxidc.com
3.linuxsay.com
4.windowsmint.com

9.pr命令

pr命令可轉換文字檔案或標準輸入，以便列印輸出。比如在Debian系統上，你可以列出所有已安裝的程式包，如下所示：

$ dpkg -l

想組織整理分成頁和列的列表、準備列印輸出，執行下面這個命令。

linuxidc@linuxidc ~ $ dpkg -l | pr --columns 3 -l 20
2017-01-06 13:19
Page 1
Desired=Unknown/Install ii adduser ii apg
| Status=Not/Inst/Conf-　 ii adwaita-icon-theme ii app-install-data
|/ Err?=(none)/Reinst-r ii adwaita-icon-theme- ii apparmor
||/ Name ii alsa-base ii apt
+++-=============== ii alsa-utils ii apt-clone
ii accountsservice ii anacron ii apt-transport-https
ii acl ii apache2 ii apt-utils
ii acpi-support 　ii apache2-bin ii apt-xapian-index
ii acpid ii apache2-data ii aptdaemon
ii add-apt-key ii apache2-utils ii aptdaemon-data
2017-01-06 13:19
Page 2
ii aptitude ii avahi-daemon ii bind9-host
ii aptitude-common ii avahi-utils ii binfmt-support
ii apturl ii aview ii binutils
ii apturl-common ii banshee ii bison
ii archdetect-deb ii baobab ii blt
ii aspell ii base-files ii blueberry
ii aspell-en ii base-passwd ii bluetooth
ii at-spi2-core ii bash ii bluez
ii attr ii bash-completion ii bluez-cups
ii avahi-autoipd ii bc ii bluez-obexd
.....

這裡使用的標誌如下：

--column定義輸出中建立的列數。

-l 指定頁長(預設頁長是66行)。

10.tr命令

這個工具可轉換或刪除來自標準輸入的字元，並將結果寫入到標準輸出。

使用tr的語法如下：

$ tr options set1 set2

不妨看一看下面的例子，在第一個命令中，set1([:upper:])表示輸入字元的大小寫(全是大寫)。

然後，set2([:lower:])表示隨後得到的字元會是小寫。第二個例子中一樣，換碼順序n意味著列印輸出到新行上：

linuxidc@linuxidc ~ $ echo "WWW.linuxidc.COM" | tr [:upper:] [:lower:]
www.linuxidc.com
linuxidc@linuxidc ~ $ echo "news.linuxidc.com" | tr [:lower:] [:upper:]
NEWS.linuxidc.COM

11.more命令

more命令是一個實用的檔案閱讀過濾器，基本上是用於檢視證書而建立的。它顯示了頁面格式的檔案內容，使用者可以按確認鍵來檢視更多資訊。

你可以用它檢視更廣龐大的檔案，就像這樣：

linuxidc@linuxidc ~ $ dmesg | more
[ 0.000000] Initializing cgroup subsys cpuset
[ 0.000000] Initializing cgroup subsys cpu
[ 0.000000] Initializing cgroup subsys cpuacct
[ 0.000000] Linux version 4.4.0-21-generic (buildd@lgw01-21) (gcc version 5.3.1 20160413 (Ubuntu 5.3.1-14ubuntu2) ) #37-Ubuntu SMP Mon Apr 18 18:33:37 UTC 2016 (Ubuntu 4.4.0-21.37-generic
4.4.6)
[ 0.000000] Command line: BOOT_IMAGE=/boot/vmlinuz-4.4.0-21-generic root=UUID=bb29dda3-bdaa-4b39-86cf-4a6dc9634a1b ro quiet splash vt.handoff=7
[ 0.000000] KERNEL supported cpus:
[ 0.000000] Intel GenuineIntel
[ 0.000000] AMD AuthenticAMD
[ 0.000000] Centaur CentaurHauls
[ 0.000000] x86/fpu: xstate_offset[2]: 576, xstate_sizes[2]: 256
[ 0.000000] x86/fpu: Supporting XSAVE feature 0x01: 'x87 floating point registers'
[ 0.000000] x86/fpu: Supporting XSAVE feature 0x02: 'SSE registers'
[ 0.000000] x86/fpu: Supporting XSAVE feature 0x04: 'AVX registers'
[ 0.000000] x86/fpu: Enabled xstate features 0x7, context size is 832 bytes, using 'standard' format.
[ 0.000000] x86/fpu: Using 'eager' FPU context switches.
[ 0.000000] e820: BIOS-provided physical RAM map:
[ 0.000000] BIOS-e820: [mem 0x0000000000000000-0x000000000009d3ff] usable
[ 0.000000] BIOS-e820: [mem 0x000000000009d400-0x000000000009ffff] reserved
[ 0.000000] BIOS-e820: [mem 0x00000000000e0000-0x00000000000fffff] reserved
[ 0.000000] BIOS-e820: [mem 0x0000000000100000-0x00000000a56affff] usable
[ 0.000000] BIOS-e820: [mem 0x00000000a56b0000-0x00000000a5eaffff] reserved
[ 0.000000] BIOS-e820: [mem 0x00000000a5eb0000-0x00000000aaabefff] usable
--More--

12.less命令

less的用途與上面的more命令恰好相反，不過它提供了額外的功能，處理大檔案時要快一點。

可以與more同樣的方式來使用它：

linuxidc@linuxidc ~ $ dmesg | less
[ 0.000000] Initializing cgroup subsys cpuset
[ 0.000000] Initializing cgroup subsys cpu
[ 0.000000] Initializing cgroup subsys cpuacct
[ 0.000000] Linux version 4.4.0-21-generic (buildd@lgw01-21) (gcc version 5.3.1 20160413 (Ubuntu 5.3.1-14ubuntu2) ) #37-Ubuntu SMP Mon Apr 18 18:33:37 UTC 2016 (Ubuntu 4.4.0-21.37-generic
4.4.6)
[ 0.000000] Command line: BOOT_IMAGE=/boot/vmlinuz-4.4.0-21-generic root=UUID=bb29dda3-bdaa-4b39-86cf-4a6dc9634a1b ro quiet splash vt.handoff=7
[ 0.000000] KERNEL supported cpus:
[ 0.000000] Intel GenuineIntel
[ 0.000000] AMD AuthenticAMD
[ 0.000000] Centaur CentaurHauls
[ 0.000000] x86/fpu: xstate_offset[2]: 576, xstate_sizes[2]: 256
[ 0.000000] x86/fpu: Supporting XSAVE feature 0x01: 'x87 floating point registers'
[ 0.000000] x86/fpu: Supporting XSAVE feature 0x02: 'SSE registers'
[ 0.000000] x86/fpu: Supporting XSAVE feature 0x04: 'AVX registers'
[ 0.000000] x86/fpu: Enabled xstate features 0x7, context size is 832 bytes, using 'standard' format.
[ 0.000000] x86/fpu: Using 'eager' FPU context switches.
[ 0.000000] e820: BIOS-provided physical RAM map:
[ 0.000000] BIOS-e820: [mem 0x0000000000000000-0x000000000009d3ff] usable
[ 0.000000] BIOS-e820: [mem 0x000000000009d400-0x000000000009ffff] reserved
[ 0.000000] BIOS-e820: [mem 0x00000000000e0000-0x00000000000fffff] reserved
[ 0.000000] BIOS-e820: [mem 0x0000000000100000-0x00000000a56affff] usable
[ 0.000000] BIOS-e820: [mem 0x00000000a56b0000-0x00000000a5eaffff] reserved
[ 0.000000] BIOS-e820: [mem 0x00000000a5eb0000-0x00000000aaabefff] usable

要是還有哪些在Linux下可充當文字過濾器的實用命令列工具是本文沒有提及的，歡迎留言補充。

原文標題：12 Useful Commands For Filtering Text for Effective File Operations in Linux，作者：Aaron Kili

本文永久更新連結地址：http://www.linuxidc.com/Linux/2017-01/139510.htm

Linux下過濾文字、實現高效檔案操作的12個實用命令

熱門文章