首页 > 代码库 > Xv6代码阅读报告之进程调度
Xv6代码阅读报告之进程调度
Xv6代码阅读报告-Topic3
@肖剑楠 20111013223
- Xv6代码阅读报告-Topic3
- 1. 序
- 2. 上下文切换
- 2.1 defs.h
- 2.2 swtch.S
- 3. 进程调度
- 4. 管道
- 5. 进程调度流程
- 6. Pipe实现概述
- 7. 阅读心得
1. 序
Xv6为了实现CPU多进程化需要解决一系列问题。1. 如何在进程间切换?2. 如何让这一切换变得透明?3. 需要锁机制来避免竞争。4. 内存、资源的自动释放。
Xv6通过实现上下文切换(Context Switching),时间中断处理,锁,睡眠与唤醒等机制基本解决了上述问题。主要代码包括swtch.S, defs.h, proc.h, proc.c, mmu.h等文件。
下面按模块对上述文件逐一分析。
2. 上下文切换
2.1 defs.h
在一切的一切之前,我们先看一下defs.h的结构体的定义以及函数的声明。
该文件中集中声明了一系列函数以及结构体,对于本章节之后需要讨论的部分,需要关注struct context
, struct proc
等结构体。 struct context
在proc.h(40-56)中定义。其结构实际上是五个寄存器的值。也就是在上下文切换时,主要做的事情就是保存并更新寄存器值。同时根据惯例,调用者会保存%eax,%ecx,%edx
的值。
struct context { uint edi; uint esi; uint ebx; uint ebp; uint eip;};
顺便将proc和pipe的结构也分析一下。 struct proc
在proc.h(60-75)中定义,通过一个结构体记录每个进程的状态。
struct proc { uint sz; // 进程的内存大小(以byte计) pde_t* pgdir; // 进程页路径的线性地址。 char *kstack; // 进程的内核栈底 enum procstate state; // 进程状态 volatile int pid; // 进程ID struct proc *parent; // 父进程 struct trapframe *tf; // 当前系统调用的中断帧 struct context *context; // 进程运行的入口 int killed; // 当非0时,表示已结束 struct file *ofile[NOFILE]; // 打开的文件列表 struct inode *cwd; // 进程当前路径 char name[16]; // 进程名称};
pipe依赖对结构体spinlock,cpu的定义,见spinlock.h及proc.h(11-24)。
spinlock的作用在于当进程请求得到一个正在被占用的锁时,将进程处于循环检查,等待锁被释放的状态。
struct spinlock { uint locked; // 锁是否处于锁住状态 // For debugging: char *name; // 锁名称 struct cpu *cpu; // 占有该锁的CPU信息 uint pcs[10]; // 占有该锁的指令栈};
pipe
的结构在pipe.h(12-19)中定义,
struct pipe { struct spinlock lock; char data[PIPESIZE]; // 保存pipe的内容,PIPESIZE为512 uint nread; // 读取的byte长度 uint nwrite; // 写入的byte长度 int readopen; // 是否正在读取 int writeopen; // 是否正在写入};
2.2 swtch.S
该文件的作用在于使用汇编代码实现了swtch函数,
.globl swtchswtch: # 将需要保存的context地址读取到%esp中,新context地址读取到%edx中 # 4(%esp)对应的是需要保存的context # 8(%esp)对应的是新的context movl 4(%esp), %eax movl 8(%esp), %edx # 将寄存器中过期的数值压栈 pushl %ebp pushl %ebx pushl %esi pushl %edi # 交换栈 movl %esp, (%eax) # 保存需要保存的context地址 movl %edx, %esp # 读取新的context信息 # 加载新的context信息 popl %edi popl %esi popl %ebx popl %ebp ret
3. 进程调度
进程调度的主要函数集中在proc.c中,就让我们从这个文件开始说起吧。
对于单个CPU来说,scheduler是最主要的函数。当CPU初始化之后,即调用scheduler(),循环从进程队列中选择一个进程执行;当进程结束时,将控制权通过swtch()移交给scheduler。
voidscheduler(void){ struct proc *p; for(;;){ // 在每次执行一个进程之前,需要调用sti()函数开启CPU的中断 sti(); // 遍历进程表找到一个进程执行 acquire(&ptable.lock); // 获取进程表的锁,避免其他CPU更改进程表 for(p = ptable.proc; p < &ptable.proc[NPROC]; p++){ // 如果进程的状态为不可运行,则略过 if(p->state != RUNNABLE) continue; // 切换到选择的进程,释放进程表锁,当进程结束时,再重新获取 proc = p; switchuvm(p); p->state = RUNNING; swtch(&cpu->scheduler, proc->context); switchkvm(); // Process is done running for now. // It should have changed its p->state before coming back. proc = 0; } release(&ptable.lock); }}
在每次Loop之后,都要及时释放进程表锁,这样可以避免当进程表中暂时没有可以运行的程序时,进程表会一直被该CPU锁死,其他CPU便不能访问。其中一种情况是,当进程等待IO时,不是RUNNABLE的,而CPU处于idle状态,一直在占有进程表锁,IO信号无法到达。
sched()切换至CPU context,在切换context之前,进行一系列判断,以避免出现冲突。
voidsched(void){ int intena; // 是否获取到了进程表锁 if(!holding(&ptable.lock)) panic("sched ptable.lock"); // 是否执行过pushcli if(cpu->ncli != 1) panic("sched locks"); // 执行的程序应该处于结束或者睡眠状态 if(proc->state == RUNNING) panic("sched running"); // 判断中断是否可以关闭 if(readeflags()&FL_IF) panic("sched interruptible"); intena = cpu->intena; // 上下文切换至scheduler swtch(&proc->context, cpu->scheduler); cpu->intena = intena;}
yield()函数将CPU主动让出一个调度周期(scheduling round),这个函数在xv6的当前版本中,仅在trap()中调用,见trap.c(100)。实际应用在于当一个进程正在使用CPU,同时中断处于打开状态,需要查看nlock。
voidyield(void){ // 获取进程表锁 acquire(&ptable.lock); // 将进程状态设为可运行,以便下次遍历时可以被唤醒 proc->state = RUNNABLE; // 执行sched函数,准备将CPU切换到scheduler context sched(); // 释放进程表锁 release(&ptable.lock);}
sleep和wakeup是两个互补的函数,共同作用实现改变进程执行顺序,
sleep函数有两个参数 void *chan
和struct spinlock *lk
。
voidsleep(void *chan, struct spinlock *lk){ if(proc == 0) panic("sleep"); if(lk == 0) panic("sleep without lk"); // 释放锁lk if(lk != &ptable.lock){ //DOC: sleeplock0 acquire(&ptable.lock); //DOC: sleeplock1 release(lk); } // 更改状态为SLEEPING,并切换至CPU context proc->chan = chan; proc->state = SLEEPING; sched(); // Tidy up. proc->chan = 0; // 重新获得刚刚释放的lk锁 if(lk != &ptable.lock){ //DOC: sleeplock2 release(&ptable.lock); acquire(lk); }}
值得注意的是,使进程进入睡眠需要两个锁,lk和ptable.lock,由于之前已经得到了ptable.lock,所以wakeup在此期间不会执行,直至进程完全进入睡眠状态,所以lk这个锁可以释放。
wakeup函数的主体部分位于wakeup1函数中。
voidwakeup(void *chan){ // 先获取ptable.lock,确保sleep不会执行,避免出现missed wakeup acquire(&ptable.lock); wakeup1(chan); // 唤醒结束,释放ptable.lock release(&ptable.lock);}
wakeup1函数完成了唤醒的主要工作。wakeup1之所以与wakeup作为两个独立的函数,是因为除了被wakeup调用之外,还在exit中调用,后面会详细讲到。
static voidwakeup1(void *chan){ struct proc *p; // 遍历进程表,当发现有符合运行条件的程序时,将其标记为RUNNABLE for(p = ptable.proc; p < &ptable.proc[NPROC]; p++) if(p->state == SLEEPING && p->chan == chan) p->state = RUNNABLE;}
wait函数用于父进程等待子进程结束,如果没有子进程,则返回-1,否则返回已经结束的子进程的pid。
intwait(void){ struct proc *p; int havekids, pid; // 获取进程表锁 acquire(&ptable.lock); for(;;){ // 遍历查找是否有处于zombie状态的子进程 havekids = 0; for(p = ptable.proc; p < &ptable.proc[NPROC]; p++){ if(p->parent != proc) continue; // 如果发现有子进程 havekids = 1; // 如果进程状态为zombie,则将其释放并返回该子进程的pid if(p->state == ZOMBIE){ // Found one. pid = p->pid; kfree(p->kstack); p->kstack = 0; freevm(p->pgdir); p->state = UNUSED; p->pid = 0; p->parent = 0; p->name[0] = 0; p->killed = 0; release(&ptable.lock); return pid; } } // 如果没有子进程则直接返回 if(!havekids || proc->killed){ release(&ptable.lock); return -1; } // 如果有子进程处于睡眠状态,则将父进程置于睡眠状态 sleep(proc, &ptable.lock); //DOC: wait-sleep }}
其中,当仍有子进程睡眠时,并没有释放ptable.lock,是因为释放操作放在了sleep函数中,且满足了sleep函数的调用条件,事先获得ptable.lock。
exit()完成了进程结束时的资源释放以及子进程处理等工作。其中只进行了一次acquire操作,这样可以使进程结束的操作原子化;同时可能存在多次的wakeup1操作,这样减少了很多时间。结束后,没有主动调用release,是因为sched进行context switching的时候需要获得ptable.lock,释放在scheduler中进行。
voidexit(void){ struct proc *p; int fd; if(proc == initproc) panic("init exiting"); // 关闭之前打开的文件 for(fd = 0; fd < NOFILE; fd++){ if(proc->ofile[fd]){ fileclose(proc->ofile[fd]); proc->ofile[fd] = 0; } } iput(proc->cwd); proc->cwd = 0; acquire(&ptable.lock); // 唤醒父进程,一边父进程将处于zombie状态的该进程回收 wakeup1(proc->parent); // 将子进程移交给initproc for(p = ptable.proc; p < &ptable.proc[NPROC]; p++){ if(p->parent == proc){ p->parent = initproc; // 如果子进程处于zombie状态,则唤醒其新父亲initproc来料理后事 if(p->state == ZOMBIE) wakeup1(initproc); } } // 移交给scheduler,等待父进程处理 proc->state = ZOMBIE; sched(); panic("zombie exit");}
4. 管道
xv6中实现管道的结构体pipe已经在前面关于defs.h的分析中提及。此处直接分析pipe.c。
pipealloc实现了pipe的创建,并将pipe关联到两个文件上f0, f1
。如果创建成功,返回0;否则返回-1。
intpipealloc(struct file **f0, struct file **f1){ struct pipe *p; p = 0; *f0 = *f1 = 0; // 如果f0,f1不存在则返回-1 if((*f0 = filealloc()) == 0 || (*f1 = filealloc()) == 0) goto bad; if((p = (struct pipe*)kalloc()) == 0) goto bad; // // 初始化pipe p->readopen = 1; p->writeopen = 1; p->nwrite = 0; p->nread = 0; initlock(&p->lock, "pipe"); (*f0)->type = FD_PIPE; (*f0)->readable = 1; (*f0)->writable = 0; (*f0)->pipe = p; (*f1)->type = FD_PIPE; (*f1)->readable = 0; (*f1)->writable = 1; (*f1)->pipe = p; return 0; // 如果创建失败,则将进度回滚,释放占用的内存、解除对文件的占有 bad: if(p) kfree((char*)p); if(*f0) fileclose(*f0); if(*f1) fileclose(*f1); return -1;}
pipeclose实现了关闭pipe的处理。
voidpipeclose(struct pipe *p, int writable){ // 获取管道锁,避免在关闭的同时进行读写操作 acquire(&p->lock); // 判断是否有未被读取的数据 if(writable){ // 如果存在,则唤醒pipe的读进程;否则唤醒写进程 p->writeopen = 0; wakeup(&p->nread); } else { p->readopen = 0; wakeup(&p->nwrite); } // 当pipe的读写都已结束时,释放资源;否则释放pipe锁 if(p->readopen == 0 && p->writeopen == 0) { release(&p->lock); kfree((char*)p); } else release(&p->lock);}
pipewrite实现了管道的写操作。
intpipewrite(struct pipe *p, char *addr, int n){ int i; acquire(&p->lock); // 逐字节写入 for(i = 0; i < n; i++){ // 如果pipe已经写满 while(p->nwrite == p->nread + PIPESIZE) { //DOC: pipewrite-full // 唤醒读进程,写进程进入睡眠,并返回-1 if(p->readopen == 0 || proc->killed){ release(&p->lock); return -1; } wakeup(&p->nread); sleep(&p->nwrite, &p->lock); //DOC: pipewrite-sleep } p->data[p->nwrite++ % PIPESIZE] = addr[i]; } // 写完之后唤醒读进程 wakeup(&p->nread); //DOC: pipewrite-wakeup1 release(&p->lock); return n;}
piperead实现了pipe的读操作。
intpiperead(struct pipe *p, char *addr, int n){ int i; acquire(&p->lock); // 如果pipe已经读空,并且正在写入,则进入睡眠状态 while(p->nread == p->nwrite && p->writeopen){ //DOC: pipe-empty if(proc->killed){ release(&p->lock); return -1; } sleep(&p->nread, &p->lock); //DOC: piperead-sleep } for(i = 0; i < n; i++){ //DOC: piperead-copy if(p->nread == p->nwrite) break; addr[i] = p->data[p->nread++ % PIPESIZE]; } // 读取完毕,唤醒写进程 wakeup(&p->nwrite); //DOC: piperead-wakeup release(&p->lock); // 返回读取的字节长度 return i;}
5. 进程调度流程
进程切换:当CPU启动之后,执行scheduler函数,无限循环。在每个周期里,从进程表中找到一个RUNNABLE的进程,切换为进程的上下文,此时开始执行函数。当函数运行结束时,调用return函数,此时切换为CPU的上下文,开始下一循环。
进程唤醒与睡眠:如果一个程序需要等待IO,则CPU会将其设置为睡眠状态,此时不能被执行。当IO信号到达时,执行的进程会将IO信号对应的进程设置为RUNNABLE,即唤醒。下一个scheduler周期的时候,该进程就可能会被执行,处理IO信号。
进程表锁:对于多处理器架构而言,需要用到进程表的时候都需要事先获得表的锁,当结束之后再释放,这样保证了对进程表操作的原子化,可以避免多处理器的竞争问题。
6. Pipe实现概述
Pipe的主要部分实际上是一小段规定长度的连续数据存储,读写操作将其视为无限循环长度的内存块。
初始化时,将给定的文件输入、输出流与该结构体关联;关闭时,释放内存,解除文件占用。
读写操作时,分别需要判断是否超出读写的范围,避免覆盖未读数据或者读取已读数据;如果写操作未执行完,则需通过睡眠唤醒的方式来完成大段数据的读取。
7. 阅读心得
由于这部分的代码主要由C代码实现,因为相对来说比第一次的阅读任务简单一些。有两个难点,一需要了解依赖的各结构体信息,并通过实际看代码认清每个属性的作用;二需要将多个函数结合着看,才能理解进程表锁的管理机制。xv6的实现机制并不复杂,主观脑洞大开结合着sched.pdf,就比较容易理解。
Xv6代码阅读报告之进程调度