首页 > 代码库 > C++中引用传递和指针传递函数参数的详解
C++中引用传递和指针传递函数参数的详解
先来分析指针这个东东:
从概念上讲,指针本质上就是存放变量地址的一个变量,在逻辑上是独立的,它可以被改变,包括其所指向的地址的改变和其指向的地址中所存放的数据的改变。
上面的图表示了程序运行时变量的值和地址,这时的内存长什么样子呢?
注意指针是一个变量,它当然有内存空间,里面存的就是一个地址,通过这个地址我们就能找到它所指向的对象。
说明:上图中两个字母p和n在最左边,代表什么?后面在介绍程序的编译过程中用到,先卖个官司。如果下面的写的东西你看不懂,没关系,往下看,我不相信你看完最后的编译原理的一点点知识,你仍然不懂!
再来分析引用这个东东:
而引用是一个别名,它在逻辑上不是独立的,它的存在具有依附性,所以引用必须在一开始就被初始化,而且其引用的对象在其整个生命周期中是不能被改变的(自始至终只能依附于同一个变量)。
上面的这段话,如果不理解,没关系,往下看。
在C++中,指针和引用经常用于函数的参数传递,然而,指针传递参数和引用传递参数是有本质上的不同的:
指针传递参数本质上是值传递的方式,它所传递的是一个地址值。值传递过程中,被调函数的形式参数作为被调函数的局部变量处理,即在栈中开辟了内存空间以存放由主调函数放进来的实参的值,从而成为了实参的一个副本。值传递的特点是被调函数对形式参数的任何操作都是作为局部变量进行,不会影响主调函数的实参变量的值。(这里是在说实参指针本身的地址值不会变)
说明:红线上面是另一个函数的占空间,该函数可以通过指针的方式修改n的值,或者修改自己的值,让自己指向其他的地址,不再指向n。但是不管怎样,它永远修改不了p的值。因为参数传递的方式是值传递。
注意:什么叫能修改p值?能修改p这个变量标识符对应的内存空间就叫做修改了p的值。
而在引用传递过程中,被调函数的形式参数虽然也作为局部变量在栈中开辟了内存空间,但是这时存放的是由主调函数放进来的实参变量的地址。被调函数对形参的任何操作都被处理成间接寻址,即通过栈中存放的地址访问主调函数中的实参变量。正因为如此,被调函数对形参做的任何操作都影响了主调函数中的实参变量。
说明:ref不再是指针方式存放n的地址,它转而存放p的地址,并且透明的对ref执行间接寻址,所以对ref的任何操作都会修改变量标识符p对应的内存空间的值。
例如程序里执行:ref =0012ff23(随意写的一个内存地址,意思就是修改指针p的内存值);
ref第一次寻址,根据编译器符号表中ref对应的内存空间地址0x0012FF36,找到这个变量标识符对应的内存空间中放的是0012FF40。
第二次寻址,把0012FF40当作地址,找到内存空间中存放的是0012FF44。
然后把0012FF44修改成2(十进制)。
引用传递和指针传递是不同的,虽然它们都是在被调函数栈空间上的一个局部变量,但是任何对于引用参数的处理都会通过一个间接寻址的方式操作到主调函数中的相关变量。而对于指针传递的参数,如果改变被调函数中的指针地址,它将影响不到主调函数的相关变量。如果想通过指针参数传递来改变主调函数中的相关变量,那就得使用指向指针的指针,或者指针引用。
说明:
(1)指针传递参数的时候,情况是上面的那张图片,指针p把自己的内存的内容copy一份到q的内存空间中去。所以p和q都是指向堆空间中的某个实例对象的,也就是说他们都存放了堆空间中这个实例对象的地址。但是我如果在被调函数中修改了q的内存中的地址,也就是说不让q指向这个实例对象了,那么这些都是合法的。并且我们无法修改主调函数中p对应的内存中的内容,也就是说无法通过p,修改p指向的堆内存实例对象。
(2)但是利用应用传递参数就不一样了,其实引用的本质仍然是指针,只不过引用对应的内存空间中存放的不是p对应的内存空间内容的备份。引用内存空间中存放的是p(也就是p对应的内存空间的地址,比如说上面的0012FF40,也就是我们之前说的编译器的符号表中的地址,p就是对应0012FF40,你在程序中写p和写0012FF40都一样,都是同一块内存空间对应的地址,只不过p更容易程序员记忆)。
并且这个引用在被调函数中的任何使用的时候都是采用透明的间接地址访问的方式,也就是说你只要对ref修改(修改的意思就是修改ref对应的内存中的东西),编译器都会做一次透明(之所以说透明,是因为这个过程是编译器私自做的,程序员是看不到的,也无法控制。当然如果你要修改编译器那就可以了)的间接寻址,把你得任何的修改都作用到指针p对应的内存空间中去。
并且这用关联是初始化以后不能修改的。到底怎么就不能修改了,看下面:
例子前面已经说过了。
那么,编译器是怎么做到透明的间接寻址的呢?下面看一下编译过程:
为了进一步加深大家对指针和引用的区别,下面我从编译的角度来阐述它们之间的区别:
程序在编译时分别将指针和引用添加到符号表上,符号表上记录的是变量名及变量所对应地址。指针变量在符号表上对应的地址值为指针变量的地址值,而引用在符号表上对应的地址值为引用对象的地址值。符号表生成后就不会再改,因此指针可以改变其指向的对象(指针变量中的值可以改),而引用对象则不能修改。
为了说明这些,下面先说一下编译原理的相关知识:
编译原理的一些简单知识:
编译器在编译我们的程序的时候,一般的编译器要对我们的源程序扫描两遍才能完成编译(当然如果用拉链-回填也可以一遍扫描,这不是我们的重点)。第一遍中很重要的一个工作就是建立符号表,第二遍就是使用这些符号进行对内存空间操作。编译器会扫描源程序中所有的变量,然后给他们建立一个表格,表格的内容就是下图所示,包括你得变量的名称(符号),对已的内存空间中的地址,变量的类型。
注意:符号表中不会有这个变量的内存空间中存储的内容。就好像我们的酒店的管理,前台可能也有一张表,里面对应着房间编号、房间地址、房间大小。
如:
1号房—>B区A栋三楼302房间—>45平
2号房—>B区C栋三楼432房间—>80平
“1号房”、“2号房”就是为了好记忆,前台就是觉得“B区A栋三楼302房间”这样的字眼太麻烦。
计算机的内存就类似,唯一不同的是我们不关心计算机给我存在哪了,也就说我只要知道我的是“几号房“,并且我记住,计算机也记住。我不管你给我放在哪个区哪栋楼几号房间。我每次想用的时候,我就说“几号房”,然后计算机通过上面的那张表给我对应找到房间的具体的位置。
编译器就是前台,维护一张表。程序员就是住户,我只知道我是“几号房”。
看到了吧,其实p和n等变量符号,就是一个地址。如上面的图n就是0x0012ff40开始的四个内存存储单元(因为n是int类型的变量,占用四个存储单元,这个跟计算机有关),之所以用n就是为了简单,不然老说0x0012ff40,一会就懵了。
还有一个东西就是p对应的内存空间中存储的东西,这个是在符号表中没有的,必须等到程序跑起来,访问内存的时候才能看到。在程序运行时,我们对变量符号(也就是对应的内存单元的地址)的任何操作,都会转化为对对应的内存单元的操作。
比如:
n=2;这个操作。
计算机会首先去符号表中查找这个变量符号,找到它对应的内存地址,如上面个的图中所示,拿着n找到了0x0012ff44,然后就根据这个地址,找到了内存的真实的存储单元(n只是为了便于我们记忆弄的一个符号,物理内存中没有这个东西的,但是我们有符号表啊,能转换到实际的内存地址)。然后就对这个内存空间按照程序的需要读写。
如果你敢没有定义这个变量n直接用,那么第一遍扫描的时候就没有登记你的n对应的内存地址是多少,你这里直接访问,那么编译器就提示变量未定义的错误。
是不是很好玩?下面回归今天的正题:
编译器就是利用符号表实对引用变量实现透明的间接地址访问的,之所以说这么多就是为了说明引用在符号表中是怎么弄的。
如果内存空间是这样的,这时的符号表长什么样子呢?
看见了吧,ref这个货竟然在符号表中不对应自己的地址(0x0012ff40),直接对应别人的地址。你如果对ref操作,计算机就拿着ref查它的内存地址,然后在对这个内存空间读写。但是一查表,就是p对应的内存空间的地址,自然而然的就操作p对应的内存空间了。
符号表在编译器第一遍读源程序后生成,然后就不会再改,因此指针可以改变其指向的对象(改变的是指针变量p的内存空间中的存储的数据),而引用对象则不能修改,也就是说ref一旦是p的引用,它就得一辈子是p的引用,因为变量符号表改不了,你只要操作ref直接就对应到了p的内存空间(ref真正的内存空间已经不重要了,谁也看不见,谁也用不到)。也许有人说,那我输出ref的地址看看,不好意思,地址就是上面的符号表中的内容。(如果真的想看,就得给编译器解刨,看看它里面是什么)
说明:由于引用本身就是目标的一个别名,引用本身的地址是一个没有意义的值,所以在c++中是无法取得引用的内存地址的。取引用的地址就是取目标的地址,c++本身就根本不提供获取引用内存地址的方法。
C++中引用传递和指针传递函数参数的详解