首頁 > 軟體

Linux中檢索檔案

2020-06-16 17:29:54

grep是Linux命令列下常用於查詢過濾文字檔案內容的命令。最簡單的用法是:

grep apple fruitlist.txt

如果想忽略大小寫,可以用-i引數:

grep -i apple fruitlist.txt

如果想搜尋目錄裡所有檔案,包括子目錄的話,並且在結果中顯示行號,可以用一下命令:

grep -nr apple *

grep的語法支援正規表示式,正規表示式有些複雜,以後再講解。下面是一些有用的引數:

  • -A num, --after-context=num: 在結果中同時輸出匹配行之後的num行
  • -B num, --before-context=num: 在結果中同時輸出匹配行之前的num行,有時候我們需要顯示幾行上下文。
  • -i, --ignore-case: 忽略大小寫
  • -n, --line-number: 顯示行號
  • -R, -r, --recursive: 遞回搜尋子目錄
  • -v, --invert-match: 輸出沒有匹配的行

我們可以通過管道操作來讓grep變得更強大,管道操作就是把前面一條命令的輸出作為後面一條命令的輸入,從而把很多簡單的命令組合起來完成複雜的功能。例如,如果我們想查詢包含apple的行,但又想過濾掉pineapple,可以用下面的命令:

grep apple fruitlist.txt | grep -v pineapple

如果我們想把搜尋結果儲存起來,那麼可以把命令的標準輸出重定向到檔案:

grep apple fruitlist.txt | grep -v pineapple > apples.txt
 

重定向符號>和管道操作符號|的區別是,重定向後面接得是一個檔案,它後面不能再接任何檔案或命令了;而管道操作後面接的是命令,可以無限地接下 去。如果想以追加方式寫到檔案,可以用>>。管道操作是Linux命令列的一種哲學,它是計算機技術中少有的能沿用幾十年的技術之一。通過管 道操作,一行命令可以完成Windows下上千行程式也不能完成的文字處理功能。

通過檔名查詢法:
這個方法說起來就和在WINDOWS下查詢檔案一樣容易理解了。如果你把這個檔案放在單個的資料夾裡面,只要使用常見的“ls"命令就能方便的查詢出來,那麼使用“find”命令來查詢它就不能給你留下深刻的印象,畢竟“find”命令的強大功能不止這個。如果知道了某個檔案的檔名,而不知道這個檔案放到哪個資料夾,甚至是層層套嵌的資料夾裡。舉例說明,假設你忘記了httpd.conf這個檔案在系統的哪個目錄下,甚至在系統的某個地方也不知道,則這是可以使用如下命令:
find / -name httpd.conf

這個命令語法看起來很容易就明白了,就是直接在find後面寫上 -name,表明要求系統按照檔名查詢,最後寫上httpd.conf這個目標檔名即可。稍等一會系統會在計算機螢幕上顯示出查詢結果列表:
etc/httpd/conf/httpd.conf

這就是httpd.conf這個檔案在Linux系統中的完整路徑。查詢成功。
如果輸入以上查詢命令後系統並沒有顯示出結果,那麼不要以為系統沒有執行find/ -name httpd.conf命令,而可能是你的系統中沒有安裝Apache伺服器,這時只要你安裝了Apache Web伺服器,然後再使用find / -name httpd.conf就能找到這個組態檔了。

無錯誤查詢技巧:
在Linux系統中“find”命令是大多數系統使用者都可以使用的命令,並不是ROOT系統管理員的專利。但是普通使用者使用“find”命令時也有可能遇 到這樣的問題,那就是Linux系統中系統管理員ROOT可以把某些檔案目錄設定成禁止存取模式。這樣普通使用者就沒有許可權用“find”命令來查詢這些目 錄或者檔案。當普通使用者使用“find”命令來查詢這些檔案目錄是,往往會出現"Permissiondenied."(禁止存取)字樣。系統將無法查詢 到你想要的檔案。為了避免這樣的錯誤,我們可是使用轉移錯誤提示的方法嘗試著查詢檔案,輸入
find / -name access_log 2>/dev/null

這個方法是把查詢錯誤提示轉移到特定的目錄中去。系統執行這個命令後,遇到錯誤的資訊就直接輸送到stderrstream 2 中,access_log 2就是表明系統將把錯誤資訊輸送到stderrstream 2中,/dev/null是一個特殊的檔案,表明空的或者錯誤的資訊,這樣查詢到的錯誤資訊將被轉移了,不會再顯示了。

在Linux系統查詢檔案也會遇到這樣一個實際問題。如果我們在整個硬碟,這個系統中查詢某個檔案就要花費相當長的一段時間,特別是大型Linux系統和 容量較大的硬碟,檔案放在套嵌很深的目錄中的時候。如果我們知道了這個檔案存放在某個大的目錄中,那麼只要在這個目錄中往下找就能節省很多時間了。使用 find /etc -name httpd.conf 就可以解決這個問題。上面的命令就是表示在etc目錄中查詢httpd.conf這個檔案。這裡再說明一下“/ ”這個函數符號的含義,如果輸入 “find/ ”就是表示要求Linux系統在整個ROOT目錄下查詢檔案,也就是在整個硬碟上查詢檔案,而“find/etc”就是只在 etc目錄下查詢檔案。因為“find/etc”表示只在etc目錄下查詢檔案,所以查詢的速度就相應要快很多了。

根據部分檔名查詢方法:
這個方法和在WINDOWS中查詢已知的檔名方法是一樣的。不過在Linux中根據部分檔名查詢檔案的方法要比在WINDOWS中的同類查詢方法要強 大得多。例如我們知道某個檔案包含有srm這3個字母,那麼要找到系統中所有包含有這3個字母的檔案是可以實現的,輸入:
find /etc -name '*srm*'

這個命令表明了Linux系統將在/etc整個目錄中查詢所有的包含有srm這3個字母的檔案,比如 absrmyz, tibc.srm等等符合條件的檔案都能顯示出來。如果你還知道這個檔案是由srm 這3個字母打頭的,那麼我們還可以省略最前面的星號,命令如下:
find/etc -name 'srm*'

這是只有像srmyz 這樣的檔案才被查詢出來,象absrmyz或者 absrm這樣的檔案都不符合要求,不被顯示,這樣查詢檔案的效率和可靠性就大大增強了。

根據檔案的特徵查詢方法:
如果只知道某個檔案的大小,修改日期等特徵也可以使用“find”命令查詢出來,這和WINDOWS系統中的"搜尋"功能是基本相同的。在微軟的"搜尋" 中WINDOWS中的"搜尋助理"使得搜尋檔案和資料夾、印表機、使用者以及網路中的其他計算機更加容易。它甚至使在Internet 上搜尋更加容易。"搜尋助理"還包括一個索引服務,該服務維護了計算機中所有檔案的索引,使得搜尋速度更快。使用"搜尋助理"時,使用者可以指定多個搜尋標準。例如,使用者可以按名稱、型別及大小搜尋檔案和資料夾。使用者甚至可以搜尋包含特定文字的檔案。如果使用者正使用 Active Directory,這時還可以搜尋帶有特定名稱或位置的印表機。

例如我們知道一個Linux檔案大小為1,500 bytes,那麼我們可是使用如下命令來查詢find / -size 1500c,字元 c 表明這個要查詢的檔案的大小是以bytes為單位。如果我們連這個檔案的具體大小都不知道,那麼在Linux中還可以進行模糊查詢方式來解決。例如我們輸入find/ -size +10000000c 這個命令,則標明我們指定系統在根目錄中查詢出大於10000000位元組的檔案並顯示出來。命令中的“+”是表示要求系統只列出大於指定大小的檔案,而使用“-”則表示要求系統列出小於指定大小的檔案。下面的列表就是在Linux使用不同“ find"命令後系統所要作出的查詢動作,從中我們很容易看出在Linux中使用“find"命令的方式是很多的,“ find"命令查詢檔案只要靈活應用,絲毫不必在WINDOWS中查詢能力差。

find / -amin -10 # 查詢在系統中最後10分鐘存取的檔案
find / -atime -2 # 查詢在系統中最後48小時存取的檔案
find / -empty # 查詢在系統中為空的檔案或者資料夾
find / -group cat # 查詢在系統中屬於 groupcat的檔案
find / -mmin -5 # 查詢在系統中最後5分鐘裡修改過的檔案
find / -mtime -1 #查詢在系統中最後24小時裡修改過的檔案
find / -nouser #查詢在系統中屬於作廢使用者的檔案
find / -user fred #查詢在系統中屬於FRED這個使用者的檔案


下面的列表就是對find命令所可以指定檔案的特徵進行查詢的部分條件。在這裡並沒有列舉所有的查詢條件,參考有關Linux有關書籍可以知道所有find命令的查詢函數。
-amin n
查詢系統中最後N分鐘存取的檔案
-atime n
查詢系統中最後n*24小時存取的檔案
-cmin n
查詢系統中最後N分鐘被改變狀態的檔案
-ctime n
查詢系統中最後n*24小時被改變狀態的檔案
-empty
查詢系統中空白的檔案,或空白的檔案目錄,或目錄中沒有子目錄的資料夾
-false
查詢系統中總是錯誤的檔案
-fstype type
查詢系統中存在於指定檔案系統的檔案,例如:ext2 .
-gid n
查詢系統中檔案數位組 ID 為 n的檔案
-group gname
查詢系統中檔案屬於gnam檔案組,並且指定組和ID的檔案


Find命令的控制選項說明:
Find命令也提供給使用者一些特有的選項來控制查詢操作。下表就是我們總結出的最基本,最常用的find命令的控制選項及其用法。
選項
用途描述
-daystart
.測試系統從今天開始24小時以內的檔案,用法類似-amin
-depth
使用深度級別的查詢過程方式,在某層指定目錄中優先查詢檔案內容
-follow
遵循萬用字元連結方式查詢; 另外,也可忽略萬用字元連結方式查詢
-help
顯示命令摘要
-maxdepth levels
在某個層次的目錄中按照遞減方法查詢
-mount
不在檔案系統目錄中查詢, 用法類似 -xdev.
-noleaf
禁止在非UNUX檔案系統,MS-DOS系統,CD-ROM檔案系統中進行最佳化查詢
-version
列印版本數位


使用-follow選項後,find命令則遵循萬用字元連結方式進行查詢,除非你指定這個選項,否則一般情況下find命令將忽略萬用字元連結方式進行檔案查詢。

-maxdepth選項的作用就是限制find命令在目錄中按照遞減方式查詢檔案的時候搜尋檔案超過某個級別或者搜尋過多的目錄,這樣導致查詢速度變慢,查詢花費的時間過多。例如,我們要在當前(.)目錄技巧子目錄中查詢一個名叫fred的檔案,我們可以使用如下命令
find . -maxdepth 2 -name fred

假如這個fred檔案在./sub1/fred目錄中,那麼這個命令就會直接定位這個檔案,查詢很容易成功。假如,這個檔案在. /sub1/sub2/fred目錄中,那麼這個命??就無法查詢到。因為前面已經給find命令在目錄中最大的查詢目錄級別為2,只能查詢2層目錄下的文 件。這樣做的目的就是為了讓find命令更加精確的定位檔案,如果你已經知道了某個檔案大概所在的檔案目錄級數,那麼加入-maxdepth n 就很快的能在指定目錄中查詢成功。

使用混合查詢方式查詢檔案
find命令可以使用混合查詢的方法,例如我們想在/tmp目錄中查詢大於100000000位元組並且在48小時內修改的某個檔案,我們可以使用-and 來把兩個查詢選項連結起來組合成一個混合的查詢方式。
find /tmp -size +10000000c -and -mtime +2

學習過計算機語言的朋友都知道,在計算機語言裡,使用and ,or 分別表示“與”和“或”的關係。在Linux系統的查詢命令中一樣通用。
還有這樣的例子,
find / -user fred -or -user george

我們可以解釋為在/tmp目錄中查詢屬於fred或者george這兩個使用者的檔案。
在find命令中還可以使用“非”的關係來查詢檔案,如果我們要在/tmp目錄中查詢所有不屬於panda的檔案,使用一個簡單的
find /tmp ! -user panda
命令就可以解決了。很簡單。

查詢並顯示檔案的方法
查詢到某個檔案是我們的目的,我們更想知道查詢到的檔案的詳細資訊和屬性,如果我們採取現查詢檔案,在使用LS命令來檢視檔案資訊是相當繁瑣的,現在我們也可以把這兩個命令結合起來使用。
find / -name "httpd.conf" -ls

系統查詢到httpd.conf檔案後立即在螢幕上顯示httpd.conf檔案資訊。
12063 34 -rw-r--r-- 1 root root 33545 Dec 30 15:36 /etc/httpd/conf/httpd.conf

下面的表格就是一些常用的查詢檔案並顯示檔案資訊的引數和使用方法
選項
用途描述
-exec command;
查詢並執行命令
-fprint file
列印檔案完整檔名
-fprint0 file
列印檔案完整檔名包括空的檔案
-fprintf file format
列印檔案格式
-ok command;
給使用者命令執行操作,根據使用者的Y 確認輸入執行
-printf format
列印檔案格式
-ls
列印同種檔案格式的檔案.


總結:到這裡為止我們已經學習了這名多關於find命令的使用方法,也列出了很多常用的find命令的選項,如果我們能熟練掌握在Linux中find命令的使用方法,那麼在Linux中查詢檔案也不是一件困難的事情

 
從根目錄開始查詢所有擴充套件名為.log的文字檔案,並找出包含”ERROR”的行
find / -type f -name "*.log" | xargs grep "ERROR"
例子:從當前目錄開始查詢所有擴充套件名為.in的文字檔案,並找出包含”thermcontact”的行
find . -name "*.in" | xargs grep "thermcontact"
 
grep的使用:
1.作用
Linux系統中grep命令是一種強大的文字搜尋工具,它能使用正規表示式搜尋文字,並把匹 配的行列印出來。grep全稱是Global Regular Expression Print,表示全域性正規表示式版本,它的使用許可權是所有使用者。
2.格式
grep [options]
3.主要引數
[options]主要引數:
-c:只輸出匹配行的計數。
-I:不區分大 小寫(只適用於單字元)。
-h:查詢多檔案時不顯示檔名。
-l:查詢多檔案時只輸出包含匹配字元的檔名。
-n:顯示匹配行及 行號。
-s:不顯示不存在或無匹配文字的錯誤資訊。
-v:顯示不包含匹配文字的所有行。
pattern正規表示式主要引數:
: 忽略正規表示式中特殊字元的原有含義。
^:匹配正規表示式的開始行。
$: 匹配正規表示式的結束行。
<:從匹配正則表達 式的行開始。
>:到匹配正規表示式的行結束。
[ ]:單個字元,如[A]即A符合要求 。
[ - ]:範圍,如[A-Z],即A、B、C一直到Z都符合要求 。
。:所有的單個字元。
* :有字元,長度可以為0。
4.grep命令使用簡單範例
 
在某一目錄下遞回[所有子目錄]查詢某一字串:
grep -r “字串” 目錄名
 
$ grep ‘test’ d*
顯示所有以d開頭的檔案中包含 test的行。
$ grep ‘test’ aa bb cc
顯示在aa,bb,cc檔案中匹配test的行。
$ grep ‘[a-z]{5}’ aa
顯示所有包含每個字串至少有5個連續小寫字元的字串的行。
$ grep ‘w(es)t.*1′ aa
如果west被匹配,則es就被儲存到記憶體中,並標記為1,然後搜尋任意個字元(.*),這些字元後面緊跟著 另外一個es(1),找到就顯示該行。如果用egrep或grep -E,就不用””號進行跳脫,直接寫成’w(es)t.*1′就可以了。
5.grep命令使用複雜範例
假設您正在’/usr/src/Linux/Doc’目錄下搜尋帶字元 串’magic’的檔案:
$ grep magic /usr/src/Linux/Doc/*
sysrq.txt:* How do I enable the magic SysRQ key?
sysrq.txt:* How do I use the magic SysRQ key?
其中檔案’sysrp.txt’包含該字串,討論的是 SysRQ 的功能。
預設情況下,’grep’只搜尋當前目錄。如果 此目錄下有許多子目錄,’grep’會以如下形式列出:
grep: sound: Is a directory
這可能會使’grep’ 的輸出難於閱讀。這裡有兩種解決的辦法:
明確要求搜尋子目錄:grep -r
或忽略子目錄:grep -d skip
如果有很多 輸出時,您可以通過管道將其轉到’less’上閱讀:
$ grep magic /usr/src/Linux/Documentation/* | less
這樣,您就可以更方便地閱讀。
有一點要注意,您必需提供一個檔案過濾方式(搜尋全部檔案的話用 *)。如果您忘了,’grep’會一直等著,直到該程式被中斷。如果您遇到了這樣的情況,按 <CTRL c> ,然後再試。
下面還有一些有意思的命令列引數:
grep -i pattern files :不區分大小寫地搜尋。預設情況區分大小寫,
grep -l pattern files :只列出匹配的檔名,
grep -L pattern files :列出不匹配的檔名,
grep -w pattern files :只匹配整個單詞,而不是字串的一部分(如匹配’magic’,而不是’magical’),
grep -C number pattern files :匹配的上下文分別顯示[number]行,
grep pattern1 | pattern2 files :顯示匹配 pattern1 或 pattern2 的行,
grep pattern1 files | grep pattern2 :顯示既匹配 pattern1 又匹配 pattern2 的行。
grep -n pattern files  即可顯示行號資訊
grep -c pattern files  即可查詢總行數
這裡還有些用於搜尋的特殊符號:
< 和 > 分別標註單詞的開始與結尾。
例如:
grep man * 會匹配 ‘Batman’、’manic’、’man’等,
grep ‘<man’ * 匹配’manic’和’man’,但不是’Batman’,
grep ‘<man>’ 只匹配’man’,而不是’Batman’或’manic’等其他的字串。
‘^’:指匹配的字串在行首,
‘$’:指匹配的字串在行 尾,
本文永久更新連結地址http://www.linuxidc.com/Linux/2016-11/136640.htm

IT145.com E-mail:sddin#qq.com