首頁 > 軟體

python 監控某個程序記憶體的情況問題

2022-05-16 16:00:26

python監控某個程序記憶體

測試場景:

  • 某個使用者端程式長時間執行後存在記憶體漏失問題,現在開發解決了需要去驗證這個問題是否還存在,並要求出具相應測試驗證報告。

手段:

  • 需要有一個工具能夠實時去獲取該程式程序一直執行下佔用記憶體,CPU使用率情況。

方法:

  • python去實現這麼個監控功能 
import sys
import time
import psutil
sys.argv
# get pid from args
#獲取命令列輸入的引數個數,sys.ary是一個列表
#如果列表引數<2,說明只輸入了python 檔名稱.py,則退出不繼續執行
if len(sys.argv) < 2:
	print ("沒有輸入要監控的程序編號")
	sys.exit()
 
#獲取程序
print("列印程序號:"+sys.argv[1])
pid = int(sys.argv[1])
p = psutil.Process(pid)
#監控程序並將獲取CPU,記憶體使用情況寫入csv檔案中
interval = 60 # 獲取CPU,記憶體使用情況輪詢時間間隔
num=100
with open("process_monitor_" + p.name() + '_' + str(pid) + ".csv", "a+") as f:
	f.write("時間,cpu使用率(%),記憶體使用率(%),記憶體使用值MBn") # csv檔案表頭列名:time,cpu使用率,記憶體使用率,記憶體佔用值MB
	while num>0:
		num=num-1
		current_time = time.strftime('%Y%m%d-%H%M%S',time.localtime(time.time()))
		cpu_percent = p.cpu_percent() # better set interval second to calculate like:  p.cpu_percent(interval=0.5)
		mem_percent = p.memory_percent()
		mem_info=p.memory_info().rss
		mem_MB=4096 / mem_percent
		print('當前程序的記憶體使用:',mem_info)
		print('當前程序的記憶體使用:%.4f MB' %mem_MB)
		line = current_time + ',' + str(cpu_percent) + ',' + str(mem_percent)+','+str(mem_MB)
		print (line)
		f.write(line + "n")
		time.sleep(interval)

python監控程序並重啟

最近公司的遊戲伺服器經常掉線,老闆只能讓員工不定時登陸伺服器看死掉沒有,都快成機器人了,因此python自動化監測程序運用指令碼就產生了。

分析了具體思路

1.做個執行緒定時器,每隔20s執行系統命令查詢指定程序名稱是否存在

2.如果不存在,就重啟;不存在就不進行後續的操作。

相關程式碼很簡單

def restart_process(process_name):
    red = subprocess.Popen('tasklist', stdout=subprocess.PIPE, stderr=subprocess.PIPE, shell=True)
    tasklist_str = red.stdout.read().decode(encoding='gbk')
    re_path = process_name.split("\")[-1]
    formattime = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
    if re_path not in tasklist_str:
        # obj = connect_emai()
        # sendmail('程式卡掉正在重啟。。。', obj)
        # 傳送HTTP請求
        # url = "http://159.138.131.148/server_offline.html"
        # request = urllib.request(url)
        global count
        count += 1
        print(formattime + '第' + str(count) + '次檢測發現異常重連')
        cmd = process_name
        os.system(process_name)
        # res = subprocess.Popen(cmd,stdout=subprocess.PIPE, stderr=subprocess.PIPE,shell=True)
        # print(res.stderr.read().decode(encoding='gbk'),res.stdout.read().decode(encoding='gbk'))
        # sendmail('重啟連線成功!',obj)
        print('yes,connected')
    else:
        global error_count
        error_count += 1
        print(formattime + '第' + str(error_count) + '次檢測正在執行中')
    global timer
    timer = Timer(20, restart_process, ("start C:Progra~1CloudControlServerCloudControlServer.exe",))
    timer.start()
count = 0
error_count = 0
timer = Timer(20, restart_process, ("start C:Progra~1CloudControlServerCloudControlServer.exe",))
timer.start()

搞定!!!

接下來有了新的需求~~  需要監控CPU的執行狀態,如果CPU一直維持在80%以上 就主動殺死程序,並重啟程序,使用了牛逼的psutil 跨系統平臺操作庫。實現程式碼如下:

def look_cpu(process_name):
    res = subprocess.Popen('wmic cpu get LoadPercentage', stdout=subprocess.PIPE, stderr=subprocess.PIPE, shell=True)
    res_str = res.stdout.read().decode(encoding='gbk')
    num = re.findall('d+', res_str)[0]
    if int(num) > 80:
        print('cup負載超過10%')
        time.sleep(10)
        res_twice = subprocess.Popen('wmic cpu get LoadPercentage', stdout=subprocess.PIPE, stderr=subprocess.PIPE,
                                     shell=True)
        res_twice_str = res_twice.stdout.read().decode(encoding='gbk')
        num_twice = re.findall('d+', res_twice_str)[0]
        # 判斷兩次監測穩定在5%以內 殺死程序並重啟
        if abs(int(num) - int(num_twice)) < 5:
            tasklist = subprocess.Popen('tasklist | findstr CloudControlServer.exe', stdout=subprocess.PIPE,
                                        stderr=subprocess.PIPE, shell=True)
            res = tasklist.stdout.read().decode(encoding='gbk')
            pid = re.search('d{1,4}', res).group()
            cmd = 'taskkill -f /pid %s' % pid
            time.sleep(0.5)
            print(cmd)
            os.system('taskkill -f /pid %s' % pid)
            os.system(process_name)
    print('正在監測cpu,cpu佔用率:%s' % num)
    global timer
    timer = Timer(30, look_cpu, ("start C:Progra~1CloudControlServerCloudControlServer.exe",))
    timer.start()

但是第三天老闆有了新的需求,需要做個web端 將CPU和記憶體資訊開放api 並且支援遠端重啟,我的思路是利用python自帶的http服務類庫,省去了socket程式設計的麻煩,直接輸入IP port  即可,這裡使用了wsgiref.simple_server

# web服務應用函數
def application(environ, start_response):
    path = environ.get('PATH_INFO')
    start_response('200 OK', [])
    # 提供cpu 狀態資訊
    if path == '/cpu':
        res = subprocess.Popen('wmic cpu get LoadPercentage', stdout=subprocess.PIPE, stderr=subprocess.PIPE,
                               shell=True)
        res_str = res.stdout.read().decode(encoding='gbk')
        resp = {'cpu': re.findall('d+', res_str)[0]}
        return [json.dumps(resp).encode(encoding='utf-8')]
    # 提供cpu + memory 資訊
    elif path == '/state':
        cpu = psutil.cpu_percent()
        memory = psutil.virtual_memory()
        memory_lv = float(memory.used) / float(memory.total) * 100
        res = {'cpu': cpu, 'memory': memory_lv}
        return [json.dumps(res).encode(encoding='utf-8')]
    # 提供重啟程序api
    elif path == '/restart_process':
        # os.system('shutdowm.exe -r')
        res = remote_restart_process("start C:Progra~1CloudControlServerCloudControlServer.exe")
        return [b'success']
# 啟動web伺服器提供api .port=8060
httpserver = make_server('', 8060, application)
httpserver.serve_forever()
'''
三個api介面:
ip:8060/cpu     cpu資訊
ip:8060/state   cpu+memory狀態
ip:8060/restart_process    重啟程序
'''

以上為個人經驗,希望能給大家一個參考,也希望大家多多支援it145.com。


IT145.com E-mail:sddin#qq.com