1. 程式人生 > >linux程序管理之概念(一)

linux程序管理之概念(一)

一、程序和執行緒的概念

1.程序和執行緒的定義

  程序並不只是一段可以執行的程式碼,也包含了執行程式碼所需要的資源。

  在作業系統來看,程序是資源管理的最小單元,而我們又知道,執行緒是程式執行的最小單元。

  話說回來,Linux系統至少有一個程序,一個程式可以對應多個程序,一個程序只能對應一個程式,一個程序包含一個或多個執行緒。

  所以,一個程序的組成實體實際是兩大部分:資源的集合和執行緒的集合。程序中的執行緒是動態的物件, 代表了程序指令的執行。資源,包括地址空間、開啟的檔案、使用者資訊等等,由程序內的執行緒共享。執行緒有自己的私有資料:程式計數器,棧空間以及暫存器。

  總結來說,在linux系統下,程序主要具有以下四個要素:

  1)有一個程式供其執行。這段程式不一定是程序所專有,可以與其他程序一起使用;

  2)有起碼的“私有財產”,這就是程序專用的系統堆疊空間;

  3)有“身份證”,也就是task_struct結構,也稱之為“程序控制塊”(PCB)。有了這個資料結構,程序才能成為核心排程的一個基本單位接受核心的排程。同時,這個結構又是程序的“財產登記卡”,記錄著程序佔用的各項資源。

  4)有獨立的儲存空間,意味著擁有專有的使用者空間;還意味著除前述的系統空間堆疊外還有其專有的使用者空間堆疊。(PS:程序的系統空間是不能獨立的,除了各程序獨有的系統堆疊空間外,任何程序都不可能直接改變使用者空間的內容)。

  以上條件是必要條件,缺少其中一條,都不能稱其為“程序”。如果只缺第四條,那就稱為“執行緒”。

  在linux系統中,“程序”和“任務”是同一個意思,在核心的程式碼中常混用這兩個名詞和概念。例如每個程序都要有一個task_struct資料結構,而其號碼卻又是pid、喚醒一個睡眠程序的函式名為wake_up_process()。

  之所以有這樣的情況是因為,linux源自Unix和i386系統結構,而unix中的程序在Intel的技術資料中稱為“任務”,嚴格來說有點區別,但是對於系統的實現來說是一回事。

2.task_struct的定義

  作業系統通過一個稱作PCB(Process Control Block,程序控制塊)的資料結構管理一個程序,也稱為tesk_struct結構體,這個結構體包含了一個程序所需的所有資訊。它定義在linux-2.6.38.8/include/linux/sched.h檔案中。

  除了最起碼的“財產”,即task_struct資料結構和系統堆疊之外,一個程序還要有一些附加的資源。例如,程序擁有堵路的儲存空間,就要有用於虛擬記憶體管理的mm_struct資料結構以及附屬的vm_area資料結構,以及相應的頁面目錄項和頁面表,

  但這些都從屬於task_struct資源。task_struct資料結構在這方面相當於登記卡的作用,其具體結構原始碼如下:

struct task_struct
{
    /*
     * offsets of these are hardcoded elsewhere - touch with care
     */
    volatile long state;  /* -1 unrunnable, 0 runnable, >0 stopped */
    unsigned long flags;  /* per process flags, defined below */
    int sigpending;
    mm_segment_t addr_limit;   /* thread address space:
    0-0xBFFFFFFF for user-thead
    0-0xFFFFFFFF for kernel-thread
     */
    struct exec_domain *exec_domain;
    volatile long need_resched;
    unsigned long ptrace;
    int lock_depth; /* Lock depth */
    
    /*
     * offset 32 begins here on 32-bit platforms. We keep
     * all fields in a single cacheline that are needed for
     * the goodness() loop in schedule().
     */
    long counter;
    long nice;
    unsigned long policy;
    struct mm_struct *mm;
    int has_cpu, processor;
    unsigned long cpus_allowed;
    
    struct list_head run_list;
    unsigned long sleep_time;
    
    struct task_struct *next_task, *prev_task;
    struct mm_struct *active_mm;
    /* task state */
    struct linux_binfmt *binfmt;
    int exit_code, exit_signal;
    int pdeath_signal;  /*  The signal sent when the parent dies  */
    
    unsigned long personality;
    int dumpable:1;
    int did_exec:1;
    pid_t pid;
    pid_t pgrp;
    pid_t tty_old_pgrp;
    pid_t session;
    pid_t tgid;
    /* boolean value for session group leader */
    int leader;
    /*
     * pointers to (original) parent process, youngest child, younger sibling,
     * older sibling, respectively.  (p->father can be replaced with
     * p->p_pptr->pid)
     */
    struct task_struct *p_opptr, *p_pptr, *p_cptr, *p_ysptr, *p_osptr;
    struct list_head thread_group;
    /* PID hash table linkage. */
    struct task_struct *pidhash_next;
    struct task_struct **pidhash_pprev;
    wait_queue_head_t wait_chldexit; /* for wait4() */
    struct semaphore *vfork_sem; /* for vfork() */
    unsigned long rt_priority;
    unsigned long it_real_value, it_prof_value, it_virt_value;
    unsigned long it_real_incr, it_prof_incr, it_virt_incr;
    struct timer_list real_timer;
    struct tms times;
    unsigned long start_time;
    long per_cpu_utime[NR_CPUS], per_cpu_stime[NR_CPUS];
    /* mm fault and swap info: this can arguably be seen as either mm-specific or thread-specific */
    unsigned long min_flt, maj_flt, nswap, cmin_flt, cmaj_flt, cnswap;
    int swappable:1;
    /* process credentials */
    uid_t uid,euid,suid,fsuid;
    gid_t gid,egid,sgid,fsgid;
    int ngroups;
    gid_t groups[NGROUPS];
    kernel_cap_t   cap_effective, cap_inheritable, cap_permitted;
    int keep_capabilities:1;
    struct user_struct *user;
    /* limits */
    struct rlimit rlim[RLIM_NLIMITS];
    unsigned short used_math;
    char comm[16];
    /* file system info */
    int link_count;
    struct tty_struct *tty; /* NULL if no tty */
    unsigned int locks; /* How many file locks are being held */
    /* ipc stuff */
    struct sem_undo *semundo;
    struct sem_queue *semsleeping;
    /* CPU-specific state of this task */
    struct thread_struct thread;
    /* filesystem information */
    struct fs_struct *fs;
    /* open file information */
    struct files_struct *files;
    /* signal handlers */
    spinlock_t sigmask_lock; /* Protects signal and blocked */
    struct signal_struct *sig;
    
    sigset_t blocked;
    struct sigpending pending;
    
    unsigned long sas_ss_sp;
    size_t sas_ss_size;
    int (*notifier)(void *priv);
    void *notifier_data;
    sigset_t *notifier_mask;
    
    /* Thread group tracking */
    u32 parent_exec_id;
    u32 self_exec_id;
    /* Protection of (de-)allocation: mm, files, fs, tty */
    spinlock_t alloc_lock;
};

下面對結構中幾個重要的成分做介紹:

  1)state(第6行)

  該變量表示程序當前執行的狀態,具體定義如下:

1 #define TASK_RUNNING              0
2 #define TASK_INTERRUPTIBLE        1
3 #define TASK_UNINTERRUPTIBLE 2 4 #define TASK_ZOMBIE 4 //殭屍程序 5 #define TASK_STOPPED 8

  狀態TASK_INTERRUPTIBLE和TASK_UNINTERRUPTIBLE均表示程序處於睡眠狀態。但是TASK_UNINTERRUPTIBLE表示程序處於“深度睡眠”,而不受“訊號”(signal,也稱軟中斷)的打擾,而TASK_INTERRUPTIBLE則可以因訊號的到來而被喚醒。核心中提供了不同的函式,讓一個程序進入不同深度的睡眠或將程序從睡眠中喚醒。具體地說,函式sleep_on()和wake_up()用於深度睡眠,而interruptible_sleep_on()和wake_up_interruptible()則用於淺度睡眠。深度睡眠一般只用於臨界區和關鍵性的部位,而“可中斷”的睡眠那就是通用的了。特別地,當程序在“阻塞性”的系統呼叫中等待某一事件發生時,應該進入可中斷睡眠,否則就不能對別的中斷做出反應,別的程序就不能通過發一個訊號來“殺掉”這個程序了。

  TASK_RUNNING狀態並不是表示一個程序正在執行中,或者說這個程序就是“當前程序”,而是表示這個程序可以被排程執行而成為當前程序。當程序處於這樣的可執行(或就緒)狀態時,核心就將該程序的task_struct結構通過其佇列頭(見第30行)掛入一個“執行佇列”。

  TASK_ZOMBIE狀態表示程序已經“去世”而戶口尚未登出。

  TASK_STOPPED主要用於除錯的目的,程序接收到 一個SIGSTOP訊號後就將執行狀態改成     TASK_STOPPED而進入“掛起”狀態,然後在接收到SIGCONT訊號時又恢復繼續執行。

  2)flags(第7行)

  flags反應程序狀態相關資訊,但並不是執行狀態,而是與管理有關的其他資訊。

   

複製程式碼
 1 #define PF_ALIGNWARN        0x00000001      /*print alignment warning msgs*/
 2 #define PF_STARTING         0x00000002      /*being created*/
 3 #define PF_EXITING 0x00000004 /*getting shut down*/  4 #define PF_FORKNOEXEC 0x00000040 /*forked but did not exec*/  5 #define PF_SUPERPRIV 0x00000100 /*uses super-user privileges*/  6 #define PF_DUMPCORE 0x00000200 /*dumped core*/  7 #define PF_SIGNALED 0x00000400 /*killed by signal*/  8 #define PF_MEMALLOC 0x00000800 /*Allocating memory*/  9 #define PF_VFORK 0x00001000 /*wake up parent in mm_release*/ 10 #define PF_USEDFPU 0x00100000 /*task used FPU this quantum(SMP)*/
複製程式碼

  3)sigpending(第8行)

  表示程序收到了“訊號”但是尚未處理。

  4)counter(第23行)

  與程序排程有關

  5)add_limit

  虛擬地址空間的上限,對程序而言是其使用者空間的上限,所以是0xbfff ffff;對核心執行緒而言則是系統空間額的上限,所以是0xffff ffff

  6)binfnt

  應用程式的檔案格式。

  7)pgrp,session,leader

  當一個使用者登入時,就開始了一個程序組(session),此後建立的程序都屬於這同一個session。

  8)user

  指向一個user_struct結構,該資料結構代表程序所屬的使用者。

  9)rlim

  這是一個結構陣列,表明程序歲各種資源的使用數量所受的限制。

3.task_struct如何在linux中被管理

  task_struct可以以三種方式被管理,他們分別是:樹,雜湊表和連結串列,具體如下圖,其中圓代表一個個程序的task_struct。