首页 > 代码库 > 浅谈linux内核栈(基于3.16-rc4)

浅谈linux内核栈(基于3.16-rc4)

在3.16-rc4内核源码中,内核给每个进程分配的内核栈大小为8KB。这个内核栈被称为异常栈,在进程的内核空间运行时或者执行异常处理程序时,使用的都是异常栈,看下异常栈的代码(include/linux/sched.h):

1 union thread_union {2     struct thread_info thread_info;3     unsigned long stack[THREAD_SIZE/sizeof(long)];4 };

THREAD_SIZE值为8KB,因此内核为进程的异常栈(内核栈)分配了两个页框大小(页框大小4KB)。另外,进程的thread_info结构体保存在栈顶部。

此外,内核为每个cpu分配一个硬中断栈和一个软中断栈(这两个栈也是内核栈),用来执行中断服务例程和下半部(软中断),看看代码(arch/x86/kernel/irq_32.c)。这两个栈属于cpu,不属于进程,这和异常栈是有区别的。

1 DEFINE_PER_CPU(struct irq_stack *, hardirq_stack);2 DEFINE_PER_CPU(struct irq_stack *, softirq_stack);

定义了两个数组hardirq_stack和softirq_stack,每个数组元素对应一个cpu,指向了该cpu的硬中断栈或者软中断栈。再来看下struct irq_stack结构体(arch/x86/include/asm/processor.h):

1 struct irq_stack {2     u32                     stack[THREAD_SIZE/sizeof(u32)];3 } __aligned(THREAD_SIZE);

可见,硬中断栈和软中断栈的大小均为8KB。

内核在执行中断处理程序时,在do_IRQ函数中会调用handle_irq函数,在handle_irq函数中要进行堆栈切换,代码如下(arch/x86/kernel/irq_32.c):

 1 bool handle_irq(unsigned irq, struct pt_regs *regs) 2 { 3     struct irq_desc *desc; 4     int overflow; 5  6     overflow = check_stack_overflow(); 7  8     desc = irq_to_desc(irq); 9     if (unlikely(!desc))10         return false;11 12     if (user_mode_vm(regs) || !execute_on_irq_stack(overflow, desc, irq)) {13         if (unlikely(overflow))14             print_stack_overflow();15         desc->handle_irq(irq, desc);16     }17 18     return true;19 }

第12行中执行execute_on_irq_stack函数来判断是否需要堆栈切换,如果不需要,则执行if体,即在当前堆栈中执行中断服务例程,如果需要切换堆栈,则不执行if体。下面看下execute_on_irq_stack代码(arch/x86/kernel/irq_32.c):

 1 static inline int 2 execute_on_irq_stack(int overflow, struct irq_desc *desc, int irq) 3 { 4     struct irq_stack *curstk, *irqstk; 5     u32 *isp, *prev_esp, arg1, arg2; 6  7     curstk = (struct irq_stack *) current_stack(); 8     irqstk = __this_cpu_read(hardirq_stack); 9 10     /*11      * this is where we switch to the IRQ stack. However, if we are12      * already using the IRQ stack (because we interrupted a hardirq13      * handler) we can‘t do that and just have to keep using the14      * current stack (which is the irq stack already after all)15      */16     if (unlikely(curstk == irqstk))17         return 0;18 19     isp = (u32 *) ((char *)irqstk + sizeof(*irqstk));20 21     /* Save the next esp at the bottom of the stack */22     prev_esp = (u32 *)irqstk;23     *prev_esp = current_stack_pointer;24 25     if (unlikely(overflow))26         call_on_stack(print_stack_overflow, isp);27 28     asm volatile("xchgl    %%ebx,%%esp    \n"29              "call    *%%edi        \n"30              "movl    %%ebx,%%esp    \n"31              : "=a" (arg1), "=d" (arg2), "=b" (isp)32              :  "0" (irq),   "1" (desc),  "2" (isp),33             "D" (desc->handle_irq)34              : "memory", "cc", "ecx");35     return 1;36 }

第7行获取当前堆栈的指针,第8行获取本地cpu的硬中断栈指针,第16行对二者进行比较,如果相等,则不需要切换堆栈(说明当前堆栈就是硬中断栈,也说明是在中断处理程序中时又发生了中断)。如果不相等,就要进行堆栈切换,第22-23行将当前堆栈指针保存在将要切换到的堆栈中(用于返回)。第28-34行,在内联汇编中进行堆栈切换并执行相应的中断服务例程,第33行将中断服务例程函数名存放在%edi中,第29行跳转到中断服务例程中。