首页 > 代码库 > 浅谈 “空指针、野指针、void*”

浅谈 “空指针、野指针、void*”

        Author: JW. Zhou

Date: 2014/7/2

一、空指针(0/NULL)

返回NULL和返回0是完全等价的,因为NULL和0都表示空指针,换句话说:空指针是什么,就是一个被赋值为0的指针,在没有被具体初始化前,其值为0;NULL 是一个标准规定的宏定义,用来表示空指针常量。

#define NULL 0   或者

#define NULL ((void*)0)

判断一个指针是否为空指针:

f(!p) 和 if(p == NULL) ,if(NULL == p)

最好使用后两种,有些平台NULL不是0,这时候程序就会有问题了。其中if(NULL == p) 与if(p == NULL) 没有区别,前一种是避免错误的写法(后面的容易写成P=NULL,编译器不能发现。而前面的写成NULL=p时会编译不过)。一般在使用指针前(特别是对其进行加减)要对其进行判断 if(p == NULL) , 如函数返回的地址等进行非空判断。

如:

Item* pItem = itemList.getItem(index);

Item* ItemList::getItem(int index)

if (index < 0)

return NULL;

if (index >= size()) return NULL;

return _list[index];

如果返回的是空指针,且后面对pItem做了相关的操作,会有空指针异常,程序可能会崩溃。调用free(p)函数后应对p置空,即p=NULL。

 

二、野指针

"野指针"不是NULL指针,是指向"垃圾"内存的指针。"野指针"的成因主要有两种:

(1)指针变量没有被初始化。任何指针变量刚被创建时不会自动成为NULL指针,它的缺省值是随机的,它会乱指一气。所以,指针变量在创建的同时应当被初始化,要么将指针设置为NULL,要么让它指向合法的内存。例如

char *p = NULL;

char *str = (char *) malloc(100);

(2)指针p被free或者delete之后,没有置为NULL,让人误以为p是个合法的指针。

free和delete只是把指针所指的内存给释放掉,但并没有把指针本身干掉。free以后其地址仍然不变(非NULL),只是该地址对应的内存是垃圾,p成了"野指针"。如果此时不把p设置为NULL,会让人误以为p是个合法的指针。如果程序比较长,我们有时记不住p所指的内存是否已经被释放,在继续使用p之前,通常会用语句if (p != NULL)进行防错处理。很遗憾,此时if语句起不到防错作用,因为即便p不是NULL指针,它也不指向合法的内存块。

char *p = (char *) malloc(100);

strcpy(p, "hello");

free(p);         // p 所指的内存被释放,但是p所指的地址仍然不变…

if(p != NULL)      // 没有起到防错作用

{

strcpy(p, "world");      // 出错

}

(3)指针操作超越了变量的作用范围。这种情况让人防不胜防,示例程序如下:

class A 

{

public:

void Func(void){ cout << "Func of class A" << endl; }

};

 

void Test(void)

{

     A *p;

      {

             A a;

            p = &a;      // 注意 a 的生命期

}

p->Func();            // p是"野指针"

}

函数Test在执行语句p->Func()时,对象a已经消失,而p是指向a的,所以p就成了"野指针"。

 

三、void*指针

void的字面意思是"无类型",void *则为"无类型指针",void *可以指向任何类型的数据。void几乎只有"注释"和限制程序的作用,因为从来没有人会定义一个void变量,让我们试着来定义:

void a;

这行语句编译时会出错,提示"illegal use of type ‘void‘"。不过,即使void a的编译不会出错,它也没有任何实际意义。void真正发挥的作用在于(1)对函数返回的限定;(2)对函数参数的限定。众所周知,如果指针p1和p2的类型相同,那么我们可以直接在p1和p2间互相赋值;如果p1和p2指向不同的数据类型,则必须使用强制类型转换运算符把赋值运算符右边的指针类型转换为左边指针的类型。 

例如:

float *p1;    

int *p2;

p1 = p2;

其中p1 = p2语句会编译出错,提示"‘=‘ : cannot convert from ‘int *‘ to ‘float *‘",必须改为:

p1 = (float *)p2;

而void *则不同,任何类型的指针都可以直接赋值给它,无需进行强制类型转换:

void *p1;

int *p2;

p1 = p2;

但这并不意味着,void *也可以无需强制类型转换地赋给其它类型的指针。因为"无类型"可以包容"有类型",而"有类型"则不能包容"无类型"。道理很简单,我们可以说"男人和女人都是人",但不能说"人是男人"或者"人是女人"。下面的语句编译出错:

void *p1;

int *p2;

p2 = p1;

提示"‘=‘ : cannot convert from ‘void *‘ to ‘int *‘"。下面给出void关键字的使用规则:

规则一 如果函数没有返回值,那么应声明为void类型

在C语言中,凡不加返回值类型限定的函数,就会被编译器作为返回整型值处理。但是许多程序员却误以为其为void类型。例如:

add ( int a, int b )

{

return a + b;

}

int main(int argc, char* argv[])

{

printf ( "2 + 3 = %d", add ( 2, 3) );

}

程序运行的结果为输出:2 + 3 = 5
  这说明不加返回值说明的函数的确为int函数。

《高质量C/C++编程》中提到:"C++语言有很严格的类型安全检查,不允许上述情况(指函数不加类型声明)发生"。可是编译器并不一定这么认定,譬如在Visual C++6.0中上述add函数的编译无错也无警告且运行正确,所以不能寄希望于编译器会做严格的类型检查。因此,为了避免混乱,我们在编写C/C++程序时,对于任何函数都必须一个不漏地指定其类型。如果函数没有返回值,一定要声明为void类型。这既是程序 良好可读性的需要,也是编程规范性的要求。另外,加上void类型声明后,也可以发挥代码的"自注释"作用。代码的"自注释"即代码能自己注释自己。

规则二 如果函数无参数,那么应声明其参数为void

在C++语言中声明一个这样的函数:

int function(void)

{

return 1;

}

则进行下面的调用是不合法的:function(2); 因为在C++中,函数参数为void的意思是这个函数不接受任何参数。

我们在Turbo C 2.0中编译:

#include "stdio.h"
fun()

{

return 1;

}

 

main()

{

 

printf("%d",fun(2));

getchar();

}

编译正确且输出1,这说明,在C语言中,可以给无参数的函数传送任意类型的参数,但是在C++编译器中编译同样的代码则会出错。在C++中,不能向无参数的函数传送任何参数,出错提示"‘fun‘ : function does not take 1 parameters"。所以,无论在C还是C++中,若函数不接受任何参数,一定要指明参数为void。

规则三 小心使用void指针类型

按照ANSI(American National Standards Institute)标准,不能对void指针进行算法操作,即下列操作都是不合法的:

void * pvoid;

pvoid++; //ANSI:错误

pvoid += 1; //ANSI:错误

//ANSI标准之所以这样认定,是因为它坚持:进行算法操作的指针必须是确定知道其指向数据类型大小的。

//例如:

int *pint;

pint++; //ANSI:正确

pint++的结果是使其增大sizeof(int)。

但是大名鼎鼎的GNU(GNU‘s Not Unix的缩写)则不这么认定,它指定void *的算法操作与char *一致。

因此下列语句在GNU编译器中皆正确:

pvoid++; //GNU:正确

pvoid += 1; //GNU:正确

pvoid++的执行结果是其增大了1。

在实际的程序设计中,为迎合ANSI标准,并提高程序的可移植性,我们可以这样编写实现同样功能的代码:

void * pvoid;

(char *)pvoid++; //ANSI:正确;GNU:正确

(char *)pvoid += 1; //ANSI:错误;GNU:正确

 

规则四 如果函数的参数可以是任意类型指针,那么应声明其参数为void *

典型的如内存操作函数memcpy和memset的函数原型分别为:

void * memcpy(void *dest, const void *src, size_t len);

void * memset ( void * buffer, int c, size_t num );

这样,任何类型的指针都可以传入memcpy和memset中,这也真实地体现了内存操作函数的意义,因为它操作的对象仅仅是一片内存,而不论这片内存是什么类型。如果memcpy和memset的参数类型不是void *,而是char *,那才叫真的奇怪了!这样的memcpy和memset明显不是一个"纯粹的,脱离低级趣味的"函数!

下面的代码执行正确:

//示例:memset接受任意类型指针

int intarray[100];    

memset ( intarray, 0, 100*sizeof(int) ); //将intarray清0

//示例:memcpy接受任意类型指针

int intarray1[100], intarray2[100];

memcpy ( intarray1, intarray2, 100*sizeof(int) ); //将intarray2拷贝给intarray1    

有趣的是,memcpy和memset函数返回的也是void *类型,标准库函数的编写者是多么地富有学问啊!

 

规则五 void不能代表一个真实的变量

下面代码都企图让void代表一个真实的变量,因此都是错误的代码:

void a; //错误

function(void a); //错误

void体现了一种抽象,这个世界上的变量都是"有类型"的,譬如一个人不是男人就是女人(还有人妖?)。

void的出现只是为了一种抽象的需要,如果你正确地理解了面向对象中"抽象基类"的概念,也很容易理解void数据类型。正如不能给抽象基类定义一个实例,我们也不能定义一个void(让我们类比的称void为"抽象数据类型")变量。

 

[参考文献或资料来源]

[1] "空指针(NULL,0),野指针,void*的讲解" http://superman474.blog.163.com/blog/static/120661462011852474666/

[2] "空指针" http://xyz64happy.blog.163.com/blog/static/9863967720081027838071/

[3] 空指针常量 http://baike.baidu.com/link?url=HHd7F4W5mfGwQdxJt3xVISp4YY_6mp9F6lm1oEmklfQ_T6h7eirxzifAlz4oLQiXZJD6sgBRWjdl7SMJQcoOcK

[4] 空指针 http://hi.baidu.com/wang_dazhi/item/c9c9ebce94891e320831c603

[5] 野指针 http://baike.baidu.com/view/1291320.htm?fr=aladdin

[6] 野指针 http://www.cnblogs.com/yc_sunniwell/archive/2010/06/28/1766854.html

[7] 野指针 http://blog.csdn.net/r77683962/article/details/8189082

[8] 野指针 http://www.cnblogs.com/viviwind/archive/2012/08/14/2638810.html