首页 > 代码库 > brk系统调用实现分析

brk系统调用实现分析

brk(addr)直接修改堆的大小。addr指定current->mm->brk的新值,返回值是线性区新的结束地址,这是一个系统调用。当用户态的进程调用brk()系统调用时,内核执行sys_brk(addr)函数。下面分析这个函数的执行流程:

1:检测addr参数是否位于进程代码段所在的线性区,如果是直接返回,因为堆不能与进程代码段所在的线性区重合。

mm=current->mm;
down_write(&mm->mmap_sem);
if(addr<mm->end_code){
out:
	up_write(&mm->mmap_sem);
	return mm->brk;
}

2:由于brk系统调用作用于一个线性区,它分配和释放完整的页。因此,该函数把addr的值调整为PAGE_SIZE的倍数,然后把调整的结果和内存描述的brk进程比较。

newbrk=(addr+0xfff)&0xfffff000;
oldbrk=(mm->brk+0xfff)&0xfffff000;
if(oldbrk==newbrk)
{
	mm->brk=addr;
	goto out;
}

3:如果进程请求缩小堆,则sys_brk()调用do_munmap()完成这项任务,然后返回

if(addr<=mm->brk)
{
	if(!do_munmap(mm,newbrk,oldbrk-newbrk))
		mm->brk=addr;
	goto out;
}

4:如果进程请求扩大堆,则sys_brk首先检查是否允许进程这么做。如果进程企图分配在其限制范围之外的内存,函数并不多分配内存,只简单返回mm->brk的原有值

rlim=current->signal->rlim[RLIMIT_DATA].rlim_cur;
if(rlim<RLIM_INFINITY & addr - mm->start_data>rlim)
	goto out;

5:然后,函数检查扩大之后的堆是否和进程的其他线性区重叠,如果是,不做任何事情就返回:

if(find_vma_itersection(mm,oldbrk,newbrk+PAGE_SIZE))
	goto out;

6:如果一切都顺利,则调用do_brk()函数。如果返回oldbrk,则分配成功且sys_brk返回addr的值,否则返回旧的mm->brk

if(do_brk(oldbrk,newbrk-oldbrk)==oldbrk)
	mm->brk=addr;
goto out;
do_brk()函数实际上是仅处理匿名线性区的do_mmap()简化版。可以认为它的调用等价于:

do_mmap(NULL,oldbrk,newbrk-oldbrk,PROT_READ|PROT_WRITE|PROT_EXEC,MAP_FIXED|MAP_PRIVATE,0)

当然do_brk()比do_mmap()稍快,因为前者假定线性区不映射磁盘上的文件,从而避免了检查线性区对象的几个字段。在这里就不介绍do_brk()函数了,因后面会写一篇专门介绍重要的do_munmap。