首页 > 代码库 > 程序各个段text,data,bss,stack,heap
程序各个段text,data,bss,stack,heap
网上找了一堆资料学习一下,了解这些,
有助于规化程序结构,优化代码;
使用gcc编译出来的程序,用size可以查看程序结构和大小,
如
1: #size hello
2: Text data bss dec hex filename
3: 778 200 4 982 3D6 hello
所以一个可执行的程序文件,结构分三部分:
.text 代码段,用来存放代码,一般是只读的区域;
.data 数据段,用来存放全局初始化变量,常量,以及全局或局部静态变量,只初始化一次;
.bss BSS段,用来存放全局未初化数据,用0初始化;
那有人问非全局变量放哪里了?
还有常说的堆和栈呢?
程序在执行时,会产生临时变量或是函数返回值,
还有函数中动态分配的地址空间,如malloc, new等…
根据这些需求,才需要堆和栈的出现,
所以堆(heap)和栈(Stack)这两个段是在程序运行时才有.
.stack 栈区,用来存放局部变量,函数的参数,返回值等,由编译器自动分配释放;
栈的概念来自数据结构,栈只能在一端操作,所以先入栈的后出,“先进后出”,这种结构保护之前的现场,
如一个函数被调用后,产生的临时变量都会存到栈区的顶部,当函数完成后,会自动从顶部将刚使用的数据销毁;
另外栈区的地址是从高地址向下增长的;
.heap 堆区,用来动态内存分配,如malloc, new申请的内存,由程序员分配释放;
程序中不释放,则程序结束时,由OS回收;据说这个和数据结构中的堆 没有什么关系;堆区使用时地址向上增长;
以上5部分在内存的位置如下图,
执行过程:
代码区的指令依次执行,代码由操作码和操作数组成,操作码决定是顺序执行,还是跳转,还是循环等;操作数可能是立即数,即具体的数直接包含在代码中,或者是局部变量,则在栈区分配空间,然后引用该数据地址执行,或者是BSS,DATA段的数据,同样引用其地址执行;
正因为代码有不同的操作,所以程序在内存中执行时,才分成不同的区,以便节约空间或访问方便;对于全局变量和静态变量,一般不会更改其值,但整个执行过程都需要访问,就单独放到一个区进行管理;临时变量生命周期短,需要频繁的操作,则统一放到栈区;用户自由分配使用的空间统一放在堆区,便于管理;
引用网上的例子,
1: //main.cpp
2: int a = 0; //a在全局已初始化数据区.data
3: char *p1; //p1在.bss(未初始化全局变量)
4: main()
5: {
6: int b; //b在栈区 .stack
7: char s[] = "abc"; //s为数组变量,存储在栈区,.heap
8: //"abc"为字符串常量,存储在已初始化数据区
9: char *p1,p2; //p1,p2在栈区
10: char *p3 = "123456"; //123456\0在已初始化数据区,p3在栈区
11: static int c =0; //C为全局(静态)数据,存在于已初始化数据区
12: //另外,静态数据会自动初始化
13: p1 = (char *)malloc(10);//分配得来的10个字节的区域在堆区
14: p2 = (char *)malloc(20);//分配得来的20个字节的区域在堆区
15: //注意p1,p2是局部变量,所以存储在栈中,10Byte空间在堆中;
16: free(p1);
17: free(p2);
18: }
19:
以下引用这个博客的,堆和栈的区别:
http://www.cnblogs.com/hfww/archive/2011/06/04/2223366.html
二、堆和栈的理论知识
2.1申请方式
stack:
由系统自动分配。 例如,声明在函数中一个局部变量 int b; 系统自动在栈中为b开辟空间
heap:
需要程序员自己申请,并指明大小,在c中malloc函数
如p1 = (char *)malloc(10);
在C++中用new运算符
如p2 = (char *)malloc(10);
但是注意p1、p2本身是在栈中的。
2.2
申请后系统的响应
栈:只要栈的剩余空间大于所申请空间,系统将为程序提供内存,否则将报异常提示栈溢出。
堆:首先应该知道操作系统有一个记录空闲内存地址的链表,当系统收到程序的申请时,
会遍历该链表,寻找第一个空间大于所申请空间的堆结点,然后将该结点从空闲结点链表中删除,并将该结点的空间分配给程序,另外,对于大多数系统, 会在这块内存空间中的首地址处记录本次分配的大小,这样,代码中的delete语句才能正确的释放本内存空间。另外,由于找到的堆结点的大小不一定正好等 于申请的大小,系统会自动的将多余的那部分重新放入空闲链表中。
2.3申请大小的限制
栈:在Windows下,栈是向低地址扩展的数据结构,是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的,在 WINDOWS下,栈的大小是2M(也有的说是1M,总之是一个编译时就确定的常数),如果申请的空间超过栈的剩余空间时,将提示overflow。因 此,能从栈获得的空间较小。
堆:堆是向高地址扩展的数据结构,是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的,自然是不连续的,而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见,堆获得的空间比较灵活,也比较大。
2.4申请效率的比较:
栈是机器系统提供的数据结构,计算机会在底层对栈提供支持:分配专门的寄存器存放栈的地址,压栈出栈都有专门的指令执行。堆则是C函数库提供的,它的机制很复杂,例如为了分配一块内存,库函数会按照一定的算法(具体的算法可以参考数据结构/操作系统)在堆内存中搜索可用的足够大的空间,如果没有足够大的空间(可能是由于内存碎片太多),就有需要操作系统来重新整理内存空间,这样就有机会分到足够大小的内存,然后返回。显然,堆的效率比栈要低得多。
栈由系统自动分配,速度较快。但程序员是无法控制的。
堆是由new分配的内存,一般速度比较慢,而且容易产生内存碎片,不过用起来最方便.
另外,在WINDOWS下,最好的方式是用VirtualAlloc分配内存,他不是在堆,也不是在栈是直接在进程的地址空间中保留一快内存,虽然用起来最不方便。但是速度快,也最灵活。
另外...VS下更改栈大小的方法,
http://www.cnblogs.com/sosi/archive/2011/03/27/1997180.html