2021-05-12 14:32:11
使用 mlocate 查詢檔案
在這一系列的文章中,我們將來看下 mlocate
,來看看如何快速、輕鬆地滿足你的需求。
對於一個系統管理員來說,草中尋針一樣的查詢檔案的事情並不少見。在一台擁擠的機器上,檔案系統中可能存在數十萬個檔案。當你需要確定一個特定的組態檔是最新的,但是你不記得它在哪裡時怎麼辦?
如果你使用過一些類 Unix 機器,那麼你肯定用過 find
命令。毫無疑問,它是非常複雜和功能強大的。以下是一個只搜尋目錄中的符號連結,而忽略檔案的例子:
#find.-lname "*"
你可以用 find
命令做幾乎無盡的事情,這是不容否認的。find
命令好用的時候是很好且簡潔的,但是它也可以很複雜。這不一定是因為 find
命令本身的原因,而是它與 xargs
結合,你可以傳遞各種選項來調整你的輸出,並刪除你找到的那些檔案。
位置、位置,讓人沮喪
然而,通常情況下簡單是最好的選擇,特別是當一個脾氣暴躁的老闆搭著你的肩膀,閒聊著時間的重要性時。你還在模糊地猜測這個你從來沒有見過的檔案的路徑,而你的老闆卻肯定它在擁擠的 /var 分割區的某處。
進一步看下 mlocate
。你也許注意過它的一個近親:slocate
,它安全地(注意字首字母 s 代表安全)記錄了相關的檔案許可權,以防止非特權使用者看到特權檔案。此外,還有它們所起源的一個更老的,原始 locate
命令。
mlocate
與其家族的其他成員(至少包括 slocate
)的不同之處在於,在掃描檔案系統時,mlocate
不需要持續重新掃描所有的檔案系統。相反,它將其發現的檔案(注意前面的 m 代表合併)與現有的檔案列表合併在一起,使其可以藉助系統快取從而效能更高、更輕量級。
在本系列文章中,我們將更仔細地了解 mlocate
(由於其流行,所以也簡稱其為 locate
),並研究如何快速輕鬆地將其調整到你心中所想的方式。
小巧和 緊湊
除非你經常重複使用複雜的命令,否則就會像我一樣,最終會忘記它們而需要在用的時候尋找它們。locate
命令的優點是可以快速查詢整個檔案系統,而不用擔心你處於頂層目錄、根目錄和所在路徑,只需要簡單地使用 locate
命令。
以前你可能已經發現 find
命令非常不聽話,讓你經常抓耳撓腮。你知道,丟失了一個分號或一個沒有正確跳脫的特殊的字元就會這樣。現在讓我們離開這個複雜的 find
命令,放鬆一下,看一下這個聰明的小命令。
你可能需要首先通過執行以下命令來檢查它是否在你的系統上:
對於 Red Hat 家族:
#yum install mlocate
對於 Debian 家族:
#apt-get install mlocate
發行版之間不應該有任何區別,但版本之間幾乎肯定有細微差別。小心。
接下來,我們將介紹 locate
命令的一個關鍵元件,名為 updatedb
。正如你可能猜到的那樣,這是更新 locate
命令的資料庫的命令。這名字非常符合直覺。
這個資料庫是我之前提到的 locate
命令的檔案列表。該列表被儲存在一個相對簡單而高效的資料庫中。updatedb
通過 cron 任務定期執行,通常在一天中的安靜時間執行。在下面的清單 1 中,我們可以看到檔案 /etc/cron.daily/mlocate.cron
的內部(該檔案的路徑及其內容可能因發行版不同)。
#!/bin/sh
nodevs=$(</proc/filesystems awk '$1 == "nodev" { print $2 }')
renice+19-p $$ >/dev/null2>&1
ionice -c2 -n7 -p $$ >/dev/null2>&1
/usr/bin/updatedb -f "$nodevs"
清單 1: 每天如何觸發 “updatedb” 命令。
如你所見,mlocate.cron
指令碼使用了優秀的 nice
命令來盡可能少地影響系統效能。我還沒有明確指出這個命令每天都在設定的時間執行(但如果我沒有記錯的話,原始的 locate
命令與你在午夜時的計算機減速有關)。這是因為,在一些 “cron” 版本上,延遲現在被引入到隔夜開始時間。
這可能是因為所謂的 “河馬之驚群Thundering Herd of Hippos”問題。想象許多計算機(或飢餓的動物)同時醒來從單一或有限的來源要求資源(或食物)。當所有的“河馬”都使用 NTP 設定它們的手錶時,這可能會發生(好吧,這個寓言扯多了,但請忍受一下)。想象一下,正好每五分鐘(就像一個 “cron 任務”),它們都要求獲得食物或其他東西。
如果你不相信我,請看下組態檔 - 清單 2 中名為 anacron
的 cron 版本,這是檔案 /etc/anacrontab
的內容。
# /etc/anacrontab: configuration filefor anacron
#See anacron(8)and anacrontab(5)for details.
SHELL=/bin/sh
PATH=/sbin:/bin:/usr/sbin:/usr/bin
MAILTO=root
# the maximal random delay added to the base delay of the jobs
RANDOM_DELAY=45
# the jobs will be started during the following hours only
START_HOURS_RANGE=3-22
#period in days delay in minutes job-identifier command
15cron.daily nice run-parts /etc/cron.daily
725cron.weekly nice run-parts /etc/cron.weekly
@monthly45cron.monthly nice run-parts /etc/cron.monthly
清單 2: 執行 “cron” 任務時延遲是怎樣被帶入的。
從清單 2 可以看到 RANDOM_DELAY
和 “delay in minutes” 列。如果你不熟悉 cron 這個方面,那麼你可以在這找到更多的東西:
#man anacrontab
否則,如果你願意,你可以自己延遲一下。有個很棒的網頁(現在已有十多年的歷史)??非常合理的方式討論了這個問題。本網站討論如何使用 sleep
來引入一個隨機性,如清單 3 所示。
#!/bin/sh
#Grab a random value between 0-240.
value=$RANDOM
while[ $value -gt 240];do
value=$RANDOM
done
#Sleepfor that time.
sleep $value
#Syncronize.
/usr/bin/rsync -aqzC --delete--delete-after masterhost::master /some/dir/
清單 3:在觸發事件之前引入隨機延遲的 shell 指令碼,以避免河馬之驚群。
在提到這些(可能令人驚訝的)延遲時,是指 /etc/crontab
或 root 使用者自己的 crontab 檔案。如果你想改變 locate
命令執行的時間,特別是由於磁碟存取速度減慢時,那麼它不是太棘手。實現它可能會有更優雅的方式,但是你也可以把檔案 /etc/cron.daily/mlocate.cron
移到別的地方(我使用 /usr/local/etc
目錄),使用 root 使用者新增一條記錄到 root 使用者的 crontab,貼上以下內容:
# crontab -e
333***/usr/local/etc/mlocate.cron
使用 anacron,而不是通過 /var/log/cron
以及它的舊的、輪轉的版本,你可以快速地告訴它上次 cron.daily 任務被觸發的時間:
#ls-hal /var/spool/anacron
下一次,我們會看更多的使用 locate
、updatedb
和其他工具來查詢檔案的方法。
via: https://www.linux.com/blog/learn/intro-to-linux/2017/11/finding-files-mlocate
作者:CHRIS BINNIE 譯者:geekpi 校對:wxy
本文永久更新連結地址:http://www.linuxidc.com/Linux/2017-11/148620.htm
相關文章