系统相关
首页 > 系统相关> > Linux 进程在内核眼中是什么样子的?

Linux 进程在内核眼中是什么样子的?

作者:互联网

本篇算是进程管理的的揭幕篇,简单介绍一个进程在内核眼里的来龙去脉,为接下来的进程创建,进程调度,进程管理等篇章做好学习准备。

从程序到进程再到内核

啥是程序,啥是进程,一张图可以给我们解释:

Linux 进程在内核眼中是什么样子的?

 

程序转换为进程的过程不是本文重点,这里不做详解,详情请看 《 Linux 程序编译过程的来龙去脉 》。接下来我们转换镜头,站在内核OS的视角看什么是程序,什么是进程。

ELF可执行文件送给内核后,OS是如何看待它的呢?换句话讲,内核OS眼里只有进程:

Linux 进程在内核眼中是什么样子的?

 

通过 top 命令我们可以看到 linux 的各种进程(即上右图)。

内核通过 task_struct 描述进程

用命令 pstree 可以让内核以树形的结构把进程之间的关系列出来,如下图:

Linux 进程在内核眼中是什么样子的?

 

这是进程在内核中的结构形式,那么内核是如何来以树形结构管理描述这些进程的呢?用来描述进程的数据结构,可以理解为进程的属性。比如进程的状态、进程的标识(PID)等,都被封装在了进程描述符这个数据结构中,一起来看下今天的主角—— task_struct 结构体。

struct task_struct {
    volatile long state;  //说明了该进程是否可以执行,还是可中断等信息 -1 unrunnable, 0     runnable, >0 stoppedunsigned long flags;  
//Flage 是进程号,在调用fork()时给出int sigpending;    
//进程上是否有待处理的信号mm_segment_t addr_limit; 
//进程地址空间,区分内核进程与普通进程在内存存放的位置不同                        //0-0xBFFFFFFF for user-thead                        
//0-0xFFFFFFFF for kernel-thread//调度标志,表示该进程是否需要重新调度,若非0,则当从内核态返回到用户态,会发生调度
volatile long need_resched;int lock_depth;  
//锁深度long nice;       //进程的基本时间片
//进程的调度策略,有三种,实时进程:SCHED_FIFO,SCHED_RR, 分时进程:SCHED_OTHER
unsigned long policy;
struct mm_struct *mm; //进程内存管理信息
int processor;//若进程不在任何CPU上运行, cpus_runnable 的值是0,否则是1 这个值在运行队列被锁时更新
unsigned long cpus_runnable, cpus_allowed;
struct list_head run_list; //指向运行队列的指针
unsigned long sleep_time;  //进程的睡眠时间//用于将系统中所有的进程连成一个双向循环链表, 其根是init_taskstruct task_struct *next_task, *prev_task;
struct mm_struct *active_mm;
struct list_head local_pages;       //指向本地页面      
unsigned int allocation_order, nr_local_pages;
struct linux_binfmt *binfmt;  //进程所运行的可执行文件的格式int exit_code, exit_signal;
int pdeath_signal;     //父进程终止时向子进程发送的信号
unsigned long personality;//Linux可以运行由其他UNIX操作系统生成的符合iBCS2标准的程序int did_exec:1; 
pid_t pid;    //进程标识符,用来代表一个进程
pid_t pgrp;   //进程组标识,表示进程所属的进程组pid_t tty_old_pgrp;  //进程控制终端所在的组标识pid_t session;  //进程的会话标识
pid_t tgid;int leader;     //表示进程是否为会话主管
struct task_struct *p_opptr,*p_pptr,*p_cptr,*p_ysptr,*p_osptr;struct list_head thread_group;   //线程链表
struct task_struct *pidhash_next; //用于将进程链入HASH表
struct task_struct **pidhash_pprev;
wait_queue_head_t wait_chldexit;  //供wait4()使用
struct completion *vfork_done;  //供vfork() 使用unsigned long rt_priority; //实时优先级,用它计算实时进程调度时的weight值
struct timer_list real_timer;   //指向实时定时器的指针
struct tms times;      //记录进程消耗的时间
unsigned long start_time;  //进程创建的时间//记录进程在每个CPU上所消耗的用户态时间和核心态时间
long per_cpu_utime[NR_CPUS], per_cpu_stime[NR_CPUS]; 
int swappable:1; //表示进程的虚拟地址空间是否允许换出
int ngroups; //记录进程在多少个用户组中
gid_t groups[NGROUPS]; //记录进程所在的组//进程的权能,分别是有效位集合,继承位集合,允许位集合kernel_cap_t cap_effective, cap_inheritable, cap_permitted;int keep_capabilities:1;
struct user_struct *user;
struct rlimit rlim[RLIM_NLIMITS];  //与进程相关的资源限制信息
unsigned short used_math;   //是否使用FPUchar comm[16];   //进程正在运行的可执行文件名 //文件系统信息
int link_count, total_link_count;//NULL if no tty 进程所在的控制终端,如果不需要控制终端,则该指针为空
struct tty_struct *tty;
unsigned int locks;//进程间通信信息struct sem_undo *semundo;  //进程在信号灯上的所有undo操作
struct sem_queue *semsleeping; //当进程因为信号灯操作而挂起时,他在该队列中记录等待的操作//进程的CPU状态,切换时,要保存到停止进程的task_struct中
struct thread_struct thread;  //文件系统信息
struct fs_struct *fs;  //打开文件信息
struct files_struct *files;  //信号处理函数spinlock_t sigmask_lock;
struct signal_struct *sig; //信号处理函数
sigset_t blocked;  //进程当前要阻塞的信号,每个信号对应一位
struct sigpending pending;  //进程上是否有待处理的信号......
};

内核就是通过list_head链表把各个进程关系以树形结构管理起来的。

task_struct 结构体内容太多,这里只列出部分成员变量,感兴趣的读者可以去源码 include/linux/sched.h头文件查看。

task_struct 中的主要信息分类:

1. 标示符:描述本进程的唯一标识符,用来区别其他进程。
2. 状态:任务状态,退出代码,退出信号等 
3. 优先级:相对于其他进程的优先级 
4. 程序计数器:程序中即将被执行的下一条指令的地址 
5. 内存指针:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针 
6. 上下文数据:进程执行时处理器的寄存器中的数据 
7. I/O状态信息:包括显示的I/O请求,分配的进程I/O设备和进程使用的文件列表 
8. 记账信息:可能包括处理器时间总和,使用的时钟总和,时间限制,记帐号等

这些信息每类都可以单独开个章节去讲解,这里先简单描述下任务状态的转换,以后篇章再深入介绍各个分类。

任务状态转换

上面可以看到变量定义后面的注释,它说明变量内容<0是不运行的,=0是运行状态,>0是停止状态。

下面我们介绍几个常用的取值:

Linux 进程在内核眼中是什么样子的?

 

任务状态在不同情况下的状态转换如下:

Linux 进程在内核眼中是什么样子的?

 

图来源于https://www.lagou.com/lgeduarticle/96239.html

内核如何存放 task_struct

我们知道一个进程所占的栈空间有用户栈和内核栈,用户栈的分布方式见之前的文章《 C语言在ARM中函数调用时,栈是如何变化的? 》。那么内核栈是如何存放进程描述符的呢?

内核栈对于应用程序是不可见的,因为它位于内核空间中。在应用程序执行过程中,如果发生异常、中断或系统调用的话,应用程序会被暂停,系统进入内核态,转去执行异常响应等代码,这个时候所使用的栈就是内核栈。

Linux 进程在内核眼中是什么样子的?

 

为了节省空间,linux把内核栈和紧挨着task_struct的thread_info放在一起,如上所示,thread_info中存放了进程/线程(内核不大区分进程与线程)的一些数据,其中包括指向task_struct结构的指针。数组stack即内核栈,stack占据8K/4K(依配置不同)空间。

union thread_union {#ifndef CONFIG_THREAD_INFO_IN_TASK  struct thread_info thread_info;#endif  unsigned long stack[THREAD_SIZE/sizeof(long)];};

最后

到这里应该已经了解了一个程序如何转换为进程,内核如何描述进程,又如何存储进程,当然还有很多关于进程的描述没有介绍,比如进程的调度,优先级,内存管理等等,这些会在以后的文章里单独分开详细介绍。但这些所有的信息都存储在今天的主角里——task_struct。

标签:task,struct,int,long,内核,Linux,进程,眼中
来源: https://blog.csdn.net/daocaokafei/article/details/113746419