首頁 > 軟體

Linux進程和task_struct()簡介

2020-06-16 17:03:17

一、構成進程的要素

在Linux系統中,進程主要具備以下要素:

1)有一個程式供其執行。這段程式不一定是進程所專有,可以與其他進程一起使用;

2)有起碼的“私有財產”,這就是進程專用的系統堆疊空間;

3)有“身份證”,也就是task_struct結構,也稱之為“過程控制塊”(PCB)。有了這個資料結構,進程才能成為核心排程的一個基本單位接受核心的排程。同時,這個結構又是進程的“財產登記卡”,記錄著進程佔用的各項資源。

4)有獨立的儲存空間,意味著擁有專有的使用者空間;還意味著除前述的系統空間堆疊外還有其專有的使用者空間堆疊。(PS:進程的系統空間是不能獨立的,除了各進程獨有的系統堆疊空間外,任何進程都不可能直接改變使用者空間的內容)。

以上條件是必要條件,缺少其中一條,都不能稱其為“進程”。如果只缺第四條,那就成為“執行緒”。特別地,如果完全沒有使用者空間,就稱其為“核心執行緒”;而如果共用使用者空間則稱其為“使用者執行緒”。在不致引起混淆的場合,二者也往往簡稱為“執行緒”。注意!!!這裡的執行緒與有些作業系統中在使用者空間的同一進程內實現的“執行緒”不一樣!既然Linux提供了對上述核心執行緒和使用者執行緒的支援,也就沒必要再在進程內部,即使用者空間內自行實現執行緒。

關於進程和執行緒的區分不是十分嚴格,在Linux系統中,許多進程在誕生之初都與其父進程共同用一個儲存空間,所以也就是使用者執行緒。但是子進程又可以建立自己的儲存空間,並與父進程“分道揚鑣”,成為與父進程一樣真正意義上的進程。

在Linux系統中,“進程”和“任務”是同一個意思,在核心的程式碼中常混用這兩個名詞和概念。例如每個進程都要有一個task_struct資料結構,而其號碼卻又是pid、喚醒一個睡眠進程的函數名為wake_up_process(),之所以有這樣的情況是因為,Linux源自Unix和i386系統結構,而unix中的進程在Intel的技術資料中稱為“任務”,嚴格來說有點區別,但是對於系統的實現來說是一回事。

Linux系統執行的第一個進程是在初始化階段“捏造出來的”。而此後的執行緒或進程都是由一個已存在的進程像細胞分裂一樣通過系統呼叫複製出來的,成為“fork()”或者“clone()”。

除了最起碼的“財產”,即task_struct資料結構和系統堆疊之外,一個進程還要有一些附加的資源。例如,進程擁有堵路的儲存空間,就要有用於虛擬記憶體管理的mm_struct資料結構以及附屬的vm_area資料結構,以及相應的頁面目錄項和頁面表,但這些都從屬於task_struct資源。task_struct資料結構在這方面相當於登記卡的作用。

二、task_struct的定義

task_struct結構原始碼:

struct task_struct
{
    /*
    * offsets of these are hardcoded elsewhere - touch with care
    */
    volatile long state;  /* -1 unrunnable, 0 runnable, >0 stopped */
    unsigned long flags;  /* per process flags, defined below */
    int sigpending;
    mm_segment_t addr_limit;  /* thread address space:
    0-0xBFFFFFFF for user-thead
    0-0xFFFFFFFF for kernel-thread
    */
    struct exec_domain *exec_domain;
    volatile long need_resched;
    unsigned long ptrace;
    int lock_depth; /* Lock depth */
   
    /*
    * offset 32 begins here on 32-bit platforms. We keep
    * all fields in a single cacheline that are needed for
    * the goodness() loop in schedule().
    */
    long counter;
    long nice;
    unsigned long policy;
    struct mm_struct *mm;
    int has_cpu, processor;
    unsigned long cpus_allowed;
   
    struct list_head run_list;
    unsigned long sleep_time;
   
    struct task_struct *next_task, *prev_task;
    struct mm_struct *active_mm;
    /* task state */
    struct linux_binfmt *binfmt;
    int exit_code, exit_signal;
    int pdeath_signal;  /*  The signal sent when the parent dies  */
   
    unsigned long personality;
    int dumpable:1;
    int did_exec:1;
    pid_t pid;
    pid_t pgrp;
    pid_t tty_old_pgrp;
    pid_t session;
    pid_t tgid;
    /* boolean value for session group leader */
    int leader;
    /*
    * pointers to (original) parent process, youngest child, younger sibling,
    * older sibling, respectively.  (p->father can be replaced with
    * p->p_pptr->pid)
    */
    struct task_struct *p_opptr, *p_pptr, *p_cptr, *p_ysptr, *p_osptr;
    struct list_head thread_group;
    /* PID hash table linkage. */
    struct task_struct *pidhash_next;
    struct task_struct **pidhash_pprev;
    wait_queue_head_t wait_chldexit; /* for wait4() */
    struct semaphore *vfork_sem; /* for vfork() */
    unsigned long rt_priority;
    unsigned long it_real_value, it_prof_value, it_virt_value;
    unsigned long it_real_incr, it_prof_incr, it_virt_incr;
    struct timer_list real_timer;
    struct tms times;
    unsigned long start_time;
    long per_cpu_utime[NR_CPUS], per_cpu_stime[NR_CPUS];
    /* mm fault and swap info: this can arguably be seen as either mm-specific or thread-specific */
    unsigned long min_flt, maj_flt, nswap, cmin_flt, cmaj_flt, cnswap;
    int swappable:1;
    /* process credentials */
    uid_t uid,euid,suid,fsuid;
    gid_t gid,egid,sgid,fsgid;
    int ngroups;
    gid_t groups[NGROUPS];
    kernel_cap_t  cap_effective, cap_inheritable, cap_permitted;
    int keep_capabilities:1;
    struct user_struct *user;
    /* limits */
    struct rlimit rlim[RLIM_NLIMITS];
    unsigned short used_math;
    char comm[16];
    /* file system info */
    int link_count;
    struct tty_struct *tty; /* NULL if no tty */
    unsigned int locks; /* How many file locks are being held */
    /* ipc stuff */
    struct sem_undo *semundo;
    struct sem_queue *semsleeping;
    /* CPU-specific state of this task */
    struct thread_struct thread;
    /* filesystem information */
    struct fs_struct *fs;
    /* open file information */
    struct files_struct *files;
    /* signal handlers */
    spinlock_t sigmask_lock; /* Protects signal and blocked */
    struct signal_struct *sig;
   
    sigset_t blocked;
    struct sigpending pending;
   
    unsigned long sas_ss_sp;
    size_t sas_ss_size;
    int (*notifier)(void *priv);
    void *notifier_data;
    sigset_t *notifier_mask;
   
    /* Thread group tracking */
    u32 parent_exec_id;
    u32 self_exec_id;
    /* Protection of (de-)allocation: mm, files, fs, tty */
    spinlock_t alloc_lock;
};

下面對結構中幾個重要的成分做介紹:

1)state(第6行)

該變數表示進程當前執行的狀態,具體定義如下:

1 #define TASK_RUNNING              0
2 #define TASK_INTERRUPTIBLE        1
3 #define TASK_UNINTERRUPTIBLE      2
4 #define TASK_ZOMBIE               4  //殭屍進程
5 #define TASK_STOPPED              8

    狀態TASK_INTERRUPTIBLE和TASK_UNINTERRUPTIBLE均表示進程處於睡眠狀態。但是TASK_UNINTERRUPTIBLE表示進程處於“深度睡眠”,而不受“信號”(signal,也稱軟中斷)的打擾,而TASK_INTERRUPTIBLE則可以因信號的到來而被喚醒。核心中提供了不同的函數,讓一個進程進入不同深度的睡眠或將進程從睡眠中喚醒。具體地說,函數sleep_on()和wake_up()用於深度睡眠,而interruptible_sleep_on()和wake_up_interruptible()則用於淺度睡眠。深度睡眠一般只用於臨界區和關鍵性的部位,而“可中斷”的睡眠那就是通用的了。特別地,當進程在“阻塞性”的系統呼叫中等待某一事件發生時,應該進入可中斷睡眠,否則就不能對別的中斷做出反應,別的進程就不能通過發一個信號來“殺掉”這個進程了。

    TASK_RUNNING狀態並不是表示一個進程正在執行中,或者說這個進程就是“當前進程”,而是表示這個進程可以被排程執行而成為當前進程。當進程處於這樣的可執行(或就緒)狀態時,核心就將該進程的task_struct結構通過其佇列頭(見第30行)掛入一個“執行佇列”。

    TASK_ZOMBIE狀態表示進程已經“去世”而戶口尚未登出。

    TASK_STOPPED主要用於偵錯的目的,進程接收到 一個SIGSTOP信號後就將執行狀態改成    TASK_STOPPED而進入“掛起”狀態,然後在接收到SIGCONT信號時又恢復繼續執行。

2)flags(第7行)

      flags反應進程狀態相關資訊,但並不是執行狀態,而是與管理有關的其他資訊。

#define PF_ALIGNWARN        0x00000001      /*print alignment warning msgs*/
#define PF_STARTING        0x00000002      /*being created*/
#define PF_EXITING          0x00000004      /*getting shut down*/
#define PF_FORKNOEXEC      0x00000040      /*forked but did not exec*/
#define PF_SUPERPRIV        0x00000100      /*uses super-user privileges*/
#define PF_DUMPCORE        0x00000200      /*dumped core*/
#define PF_SIGNALED        0x00000400      /*killed by signal*/
#define PF_MEMALLOC        0x00000800      /*Allocating memory*/
#define PF_VFORK            0x00001000      /*wake up parent in mm_release*/
#define PF_USEDFPU          0x00100000      /*task used FPU this quantum(SMP)*/

3)sigpending(第8行)

    表示進程收到了“信號”但是尚未處理。

4)counter(第23行)

    與進程排程有關

5)add_limit

    虛擬地址空間的上限,對進程而言是其使用者空間的上限,所以是0xbfff ffff;對核心執行緒而言則是系統空間額的上限,所以是0xffff ffff

6)binfnt

    應用程式的檔案格式。

7)pgrp,session,leader

    當一個使用者登入時,就開始了一個行程群組(session),此後建立的進程都屬於這同一個session。

8)user

    指向一個user_struct結構,該資料結構代表進程所屬的使用者。

9)rlim

    這是一個結構陣列,表明進程歲各種資源的使用數量所受的限制。

本文永久更新連結地址http://www.linuxidc.com/Linux/2017-11/148215.htm


IT145.com E-mail:sddin#qq.com