Linux常用系統效能監控命令

2020-06-16 18:00:42

Linux常用系統效能監控命令

監控CPU使用率

使用下面的命令：

[root@localhost ~]# gnome-system-monitor

將會出現圖形化工具GNOME System Monitor，如下圖所示：

監控CPU排程程式執行佇列

linux可以使用vmstat命令

vmstat是Virtual Meomory Statistics（虛擬記憶體統計）的縮寫, 是實時系統監控工具。該命令通過使用knlist子程式和/dev/kmen偽裝置驅動器存取這些資料，輸出資訊直接列印在螢幕。vmstat反饋的與CPU相關的資訊包括：
（1）多少任務在執行
（2）CPU使用的情況
（3）CPU收到多少中斷
（4）發生多少上下文切換

下面只介紹 Vmstat與CPU相關的引數

vmstat的語法如下：

vmstat [delay [count]]

引數的含義如下：

引數	解釋
delay	相鄰的兩次取樣的間隔時間
count	取樣的次數，count只能和delay一起使用

當沒有引數時，vmstat則顯示系統啟動以後所有資訊的平均值。有delay時，第一行的資訊自系統啟動以來的平均資訊。從第二行開始，輸出為前一個delay時間段的平均資訊。當系統有多個CPU時，輸出為所有CPU的平均值。

引數	解釋	從/proc/stat獲得資料
r	在internal時間段裡，執行佇列裡等待CPU的任務（任務）的個數，即不包含vmstat進程	procs_running-1
b	在internal時間段裡，被資源阻塞的任務數（I/0，頁面排程，等等.）通常情況下是接近0的	procs_blocked
us	在internal時間段裡，使用者態的CPU時間(%)，包含 nice值為負進程	(user+nice)/total*100
sy	在internal時間段裡，核心態的CPU時間(%)	(system+irq+softirq)/total*100
id	在internal時間段裡，cpu空閒的時間，不包括等待i/o的時間(%)	idle/total*100
wa	在internal時間段裡，等待i/o的時間(%)	iowait/total*100
in	在internal時間段裡，每秒發生中斷的次數	intr/interval
cs	在internal時間段裡，每秒上下文切換的次數，即每秒核心任務交換的次數	ctxt/interval

total_cur = user + system + nice + idle + iowait + irq + softirq

total_pre = pre_user + pre_system + pre_nice + pre_idle + pre_iowait + pre_irq + pre_softirq

total = total_cur - total_pre

[root@localhost ~]# vmstat

執行結果如下：

監控鎖競爭

使用 sysstat包中的pidstat命令來監控

[root@localhost ~]# pidstat

執行結果如下：

Linux 2.6.32-431.el6.x86_64 (localhost.localdomain) 05/07/15 _x86_64_ (1 CPU)

09:58:18 PID %usr %system %guest %CPU CPU Command
09:58:18 1 0.00 0.00 0.00 0.00 0 init
09:58:18 4 0.00 0.00 0.00 0.00 0 ksoftirqd/0

……

09:58:18 37143 0.00 0.00 0.00 0.00 0 dbus-launch
09:58:18 37144 0.00 0.00 0.00 0.00 0 dbus-daemon
09:58:18 37268 0.00 0.00 0.00 0.00 0 fprintd
09:58:18 37272 0.00 0.00 0.00 0.00 0 pidstat

監控網路I/O使用率

nicstat原本是Solaris平台下顯示網絡卡流量的工具，Tim Cook將它移植到linux平台

首先安裝之，原始碼在這裡下，這裡使用的版本是1.92。

安裝make環境:

yum install gcc gcc-c++ make automake autoconf -y

由於nicstat依賴32 bit glibc package，所以

yum install libgcc.i686 glibc.i686 glibc-devel.i686  -y

下載檔案並安裝:

# wget -c http://nchc.dl.sourceforge.net/project/nicstat/nicstat-1.92.tar.gz
# tar zxvf nicstat-1.92.tar.gz
# cd nicstat-1.92
# cp Makefile.Linux Makefile
# uname -m

[root@localhost nicstat-1.92]# make
gcc -O3 -m32 nicstat.c -o nicstat
nicstat.c:99:1: warning: "DUPLEX_UNKNOWN" redefined
In file included from nicstat.c:84:
/usr/include/linux/ethtool.h:691:1: warning: this is the location of the previous definition
mv nicstat `./nicstat.sh --bin-name`

[root@localhost nicstat-1.92]# ./nicstat.sh

磁碟I/O使用率

iostat [-t] [-c] [interval [count]]

引數的含義如下：

引數	解釋
T	表示輸出採用的時間
C	表示只顯示CPU的資訊
Internal	相鄰的兩次取樣的間隔時間
count	取樣的次數，count只能和delay一起使用

當沒有引數時，iostat則顯示系統啟動以後所有資訊的平均值。與CPU有關的輸出的含義

引數	解釋	從/proc/stat獲得
CPU	處理器ID
user	在internal時間段裡，使用者態的CPU時間（%），不包含 nice值為負進程	usr/total*100
nice	在internal時間段裡，nice值為負進程的CPU時間（%）	nice/total*100
sys	在internal時間段裡，核心時間（%）	(system+irq+softirq)/total*100
iowait	在internal時間段裡，硬碟IO等待時間（%）	iowait/total*100
idle	在internal時間段裡，CPU除去等待磁碟IO操作外的因為任何原因而空閒的時間閒置時間（%）	idle/total*100

total_cur = user + system + nice + idle + iowait + irq + softirq

total_pre = pre_user + pre_system + pre_nice + pre_idle + pre_iowait + pre_irq + pre_softirq

total = total_cur - total_pre

有interval時，第一行的資訊自系統啟動以來的平均資訊。從第二行開始，輸出為前一個interval時間段的平均資訊。

使用iostat命令

[root@localhost ~]# iostat

執行結果如下：

Linux 2.6.32-431.el6.x86_64 (localhost.localdomain) 05/07/15 _x86_64_ (1 CPU)

avg-cpu: %user %nice %system %iowait %steal %idle
6.12 0.00 1.35 2.35 0.00 90.19

Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sda 6.03 267.11 272.53 26904430 27450404

PS：附上Brendan Gregg 個人站點上分享了很多 Linux 效能相關的資源：

Linux observability tools | Linux 效能觀測工具

Linux benchmarking tools | Linux 效能測評工具

IT145.com E-mail:sddin#qq.com

Linux常用系統效能監控命令

監控CPU使用率

監控CPU排程程式執行佇列

監控鎖競爭

監控網路I/O使用率

磁碟I/O使用率

熱門文章