首页 > 代码库 > C++智能指针简单剖析

C++智能指针简单剖析

导读

智能指针是行为类似于指针的类对象,所有的智能指针都会重载 -> 和 操作符。智能指针还有许多其他功能,比较有用的是自动销毁。这主要是利用栈对象的有限作用域以及临时对象(有限作用域实现)析构函数释放内存。当然,智能指针还不止这些,还包括复制时可以修改源对象等。智能指针根据需求不同,设计也不同(写时复制,赋值即释放对象拥有权限、引用计数等,控制权转移等)。智能指针是存储指向动态分配(堆)对象指针的类,用于生存期控制,能够确保自动正确的销毁动态分配的对象,防止内存泄露。 智能指针类将一个计数器与类指向的对象相关联,引用计数跟踪该类有多少个对象共享同一指针。每次创建类的新对象时,初始化指针并将引用计数置为1;当对象作为另一对象的副本而创建时,拷贝构造函数拷贝指针并增加与之相应的引用计数;对一个对象进行赋值时,赋值操作符减少左操作数所指对象的引用计数(如果引用计数为减至0,则删除对象),并增加右操作数所指对象的引用计数;调用析构函数时,构造函数减少引用计数(如果引用计数减至0,则删除基础对象)。 本文主要介绍3个可帮助管理动态内存分配的智能指针模板(auto_ptrunique_ptrshared_ptr)。

目录

1智能指针设计思想

2智能指针简单介绍

3、为何摒弃auto_ptr

4unique_ptr为何优于auto_ptr

5、如何选择智能指针

正文

1智能指针设计思想

先来看一下需要哪些功能以及这些功能是如何实现的。请看下面的函数:

void remodel(std::string & str){	std::string * ps = new std::string(str);	...	str = ps;	return;}

 每当调用时,该函数都分配堆中的内存,但从不收回,从而导致内存泄漏。此时只要不忘记在return前添加下面语句释放内存即可:

delete ps ;

 然而,请大家再看一个例子:

void remodel(std::string & str){	std::string * ps = new std::string(str);	...	if (weird_thing())		throw exception();	str = *ps;	delete ps;	return;}

当抛出异常时,delete将不被执行,因此也将导致内存泄漏。问题显现出来了吧,有没有一种灵巧的解决办法呢?这就是本文要说的智能指针!

现在来看一下,如果设计一个智能指针需要什么。

remodel()这样的函数终止(不管是正常终止,还是异常终止),本地变量都将从栈内存中删除——指针ps占据的内存将被释放。如果ps指向的内存也被释放,那该有多好啊。如果ps有一个析构函数,该析构函数将在ps过期时释放它指向的内存。因此,ps的问题在于,它只是一个常规指针,不是有析构函数的类对象。如果它是对象,则在对象过期时,让它的析构函数删除指向的内存。这个正就是智能指针模板(auto_ptrunique_ptrshared_ptr)背后的思想

按以下3个步骤用智能指针模板auto_ptr进行转换remodel()函数:

  • 包含头义件memory(智能指针所在的头文件);
  • 将指向string的指针替换为指向string的智能指针对象;
  • 删除delete语句。
#include <memory>using namespace std;void remodel(std::string & str){	std::auto_ptr<std::string> ps(new std::string(str));		...	if (weird_thing())		throw exception();		str = *ps;		// delete ps; NO LONGER NEEDED		return;}

 2、智能指针简单介绍

在介绍之前先看一个简单程序,再对智能指针作一个简单的介绍。该程序演示了如何使用3种智能指针。

//smrtptrs.cpp --using three kinds of smart pointers//requires support of C++11 shared_ptr and unique_ptr#include <iostream>#include <string>#include <memory>using namespace std;class Report{private:	string str;public:	Report(const string s):str(s){		cout << "Object created !" << endl;	}	~Report(){		cout << "Object deleted !" << endl;	}	void comment() const{		cout << str << endl;	}};int main(){	{		auto_ptr<Report> ps(new Report("using auto_ptr"));		ps->comment();	}	{		unique_ptr<Report> ps(new Report("using unique_ptr"));		ps->comment();	}	{		shared_ptr<Report> ps(new Report("using shared_ptr"));		ps->comment();	}	return 0;}

执行结果:

Object created !using auto_ptrObject deleted !Object created !using unique_ptrObject deleted !Object created !using shared_ptrObject deleted !

现在来分析一下这三个智能指针模板(auto_ptrunique_ptrshared_ptr)。

我们可以将new获得(直接或者间接)的地址赋给这种对象,当智能指针过期时,其析构函数将使用delete来释放内存。

要创建智能指针对象,必须包含文件memory,该文件含有智能指针模板的定义,然后使用通常的模板语法来实例化所需类型的指针。所有的智能指针类都有一个explicit构造函数,例如,其中智能指针auto_ptr包含如下构造函数:

templet<class T>class auto_ptr {public:	explicit auto_ptr(X* p = 0) throw{};		...};

因此,请求X类型的auto_ptr将获得一个指向X类型的auto_ptr:

auto_ptr<double> pd(new double);// pd  an auto_ptr to double// use in place of double *pdauto_ptr<string> pd(new string);// pd  an auto_ptr to string// use in place of double *string

new double 是new 返回的指针,指向新分配的内存块,它是auto_ptr<double>的参数,即对应于原型中形参p的实参。同样,new string也是构造函数的实参。另外两种智能指针使用同样的语法:

unique_ptr<double> pd(new double);shared_ptr<double> pd(new double);

但是要注意的是,三种智能指针都应该避免一点:

string vacation("I wandered lonely as a cloud.");shared_ptr<string> pvac(&vacation);   // No

pvac过期时,程序将把delete运算符用于非堆内存,这是错误的。

3、为何摒弃auto_ptr

先来看下面的赋值语句

auto_ptr<string>  ps (new string ("I reigned lonely as a cloud.”);auto_ptr<string>  vocation; vocaticn = ps;

上述赋值语句将完成什么工作呢?如果psvocation是常规指针,则两个指针将指向同一个string对象。这是不能接受的,因为程序将试图删除同一个对象两次——一次是ps过期时,另一次是vocation过期时。要避免这种问题,方法有多种:

  • 定义陚值运算符,使之执行深复制。这样两个指针将指向不同的对象,其中的一个对象是另一个对象的副本,缺点是浪费空间,所以智能指针都未采用此方案。

  • 建立所有权(ownership)概念。对于特定的对象,只能有一个智能指针可拥有,这样只有拥有对象的智能指针的构造函数会删除该对象。然后让赋值操作转让所有权。这就是用于auto_ptruniqiie_ptr 的策略,但unique_ptr的策略更严格。

  • 创建智能更高的指针,跟踪引用特定对象的智能指针数。这称为引用计数。例如,赋值时,计数将加1,而指针过期时,计数将减1,。当减为0时才调用delete。这是shared_ptr采用的策略。

当然,同样的策略也适用于复制构造函数。

每种方法都有其用途,但为何说要摒弃auto_ptr呢?

先看一个例子:

#include <iostream>#include <string>#include <memory>using namespace std;int main() {  auto_ptr<string> films[5] = {  auto_ptr<string> (new string("Fowl Balls")),  auto_ptr<string> (new string("Duck Walks")),  auto_ptr<string> (new string("Chicken Runs")),  auto_ptr<string> (new string("Turkey Errors")),  auto_ptr<string> (new string("Goose Eggs")) }; auto_ptr<string> pwin; pwin = films[2]; // films[2] loses ownership. 将所有权从films[2]转让给pwin,此时films[2]不再引用该字符串从而变成空指针 cout << "The nominees for best avian baseballl film are\n"; for(int i = 0; i < 5; ++i)  cout << *films[i] << endl; cout << "The winner is " << *pwin << endl; cin.get(); return 0;}

该程序运行结果是崩溃了,但是,如果把auto_ptr<string> pwin;改成shared_ptr<string> pwin;编译后执行结果却正常了。如果把auto_ptr<string> pwin;改成unique_ptr<string> pwin;编译语句pwin = films[2];时不能通过。

原因如下:

  • 使用shared_ptr时运行正常,因为shared_ptr采用引用计数,pwinfilms[2]都指向同一块内存,在释放空间时因为事先要判断引用计数值的大小因此不会出现多次删除一个对象的错误。

  • 使用unique_ptr时编译出错,与auto_ptr一样,unique_ptr也采用所有权模型,但在使用unique_ptr时,程序不会等到运行阶段崩溃,而在编译器因下述代码行出现错误。

4、unique_ptr为何优于auto_ptr

可能大家认为前面的例子已经说明了unique_ptr为何优于auto_ptr,也就是安全问题,下面再叙述的清晰一点。请看下面的语句

auto_ptr<string> p1(new string ("auto") ; //#1auto_ptr<string> p2;                       //#2p2 = p1;                                   //#3

在语句#3中,p2接管string对象的所有权后,p1的所有权将被剥夺。前面说过,这是好事,可防止p1p2的析构函数试图刪同—个对象;但如果程序随后试图使用p1,这将是件坏事,因为p1不再指向有效的数据。

下面来看使用unique_ptr的情况:

unique_ptr<string> p3 (new string ("auto");   //#4unique_ptr<string> p4;                       //#5p4 = p3;                                      //#6

编译器认为语句#6非法,避免了p3不再指向有效数据的问题。因此,unique_ptrauto_ptr更安全(编译阶段错误比潜在的程序崩溃更安全)。

有时候,会将一个智能指针赋给另一个并不会留下危险的悬挂指针。假设有如下函数定义:

unique_ptr<string> demo(const char * s){    unique_ptr<string> temp (new string (s));    return temp;}

并假设编写了如下代码:

unique_ptr<string> ps;
ps = demo(‘Uniquely special");

demo() 返回一个临时unique_ptr,然后ps接管了原本归返回的unique_ptr所有的对象,而返回时临时的 unique_ptr 被销毁,也就是说没有机会使用 unique_ptr 来访问无效的数据,换句话来说,这种赋值是不会出现任何问题的,即没有理由禁止这种赋值。实际上,编译器确实允许这种赋值。

总之,当程序试图将一个 unique_ptr 赋值给另一个时,如果源 unique_ptr 是个临时右值,编译器允许这么做;如果源 unique_ptr 将存在一段时间,编译器将禁止这么做,比如:

unique_ptr<string> pu1(new string ("hello world"));unique_ptr<string> pu2;_x000D_pu2 = pu1;          // #1 not allowedunique_ptr<string> pu3;pu3 = unique_ptr<string>(new string ("yoyos"));   // #2 allowed

其中#1留下悬挂的unique_ptr(pu1),这可能导致危害。而#2不会留下悬挂的unique_ptr,因为它调用 unique_ptr 的构造函数,该构造函数创建的临时对象在其所有权让给 pu3 后就会被销毁。这种随情况而已的行为表明,unique_ptr 优于允许两种赋值的auto_ptr 

当然,您可能确实想执行类似于#1的操作,仅当以非智能的方式使用摒弃的智能指针时(如解除引用时),这种赋值才不安全。要安全的重用这种指针,可给它赋新值。C++ 有一个标准库函数std::move(),让你能够将一个unique_ptr赋给另一个。原来的指针仍转让所有权变成空指针,可以对其重新赋值。下面是一个使用前述demo()函数的例子,该函数返回一个 unique_ptr<string> 对象:

unique_ptr<string> ps1, ps2;ps1 = demo("hello");ps2 = move(ps1);ps1 = demo("alexia");cout << *ps2 << *ps1 << endl;

相比于auto_ptrunique_ptr还有另一个优点,它有一个可用于数组的变体,这里就不作细节讨论了。

5、如何选择智能指针

在现实中我们该如何选择智能指针呢?下面给出几个选择方法:

  • 如果程序要使用多个指向同一个对象的指针,应选择shared_ptr
  1. 有一个指针数组,并使用一些辅助指针来标示特定的元素,如最大的元素和最小的元素;
  2. 两个对象包含都指向第三个对象的指针;
  3. STL容器包含指针。很多STL算法都支持复制和赋值操作,这些操作可用于shared_ptr,但不能用于unique_ptr(编译器发出warning)和auto_ptr(行为不确定)。如果你的编译器没有提供shared_ptr,可使用Boost库提供的shared_ptr
  • 如果程序不需要多个指向同一个对象的指针,则可使用unique_ptr
  • 如果函数使用new分配内存,并返还指向该内存的指针,将其返回类型声明为unique_ptr是不错的选择。这样,所有权转让给接受返回值的unique_ptr,而该智能指针将负责调用delete。可将unique_ptr存储到STL容器在那个,只要不调用将一个unique_ptr复制或赋给另一个算法(如sort())。例如,可在程序中使用类似于下面的代码段:
unique_ptr<int> make_int(int n){    return unique_ptr<int>(new int(n));}void show(unique_ptr<int> &p1){    cout << *a << ‘ ‘;}int main(){    ...    vector<unique_ptr<int> > vp(size);    for(int i = 0; i < vp.size(); i++)        vp[i] = make_int(rand() % 1000);              // copy temporary unique_ptr    vp.push_back(make_int(rand() % 1000));     // ok because arg is temporary    for_each(vp.begin(), vp.end(), show);           // use for_each()    ...}

其中push_back调用没有问题,因为它返回一个临时unique_ptr,该unique_ptr被赋给vp中的一个unique_ptr。另外,如 果按值而不是按引用给show()传递对象,for_each()将非法,因为这将导致使用一个来自vp的非临时unique_ptr初始化pi,而这是 不允许的。前面说过,编译器将发现错误使用unique_ptr的企图。

unique_ptr为右值时,可将其赋给shared_ptr,这与将一个unique_ptr赋给一个需要满足的条件相同。与前面一样,在下面的代码中,make_int()的返回类型为unique_ptr<int>

unique_ptr<int> pup(make_int(rand() % 1000));   // okshared_ptr<int> spp(pup);                       // not allowed, pup as lvaluehared_ptr<int> spr(make_int(rand() % 1000));   // ok

模板shared_ptr包含一个显式构造函数,可用于将右值unique_ptr转换为shared_ptrshared_ptr将接管原来归unique_ptr所有的对象。

在满足unique_ptr要求的条件时,也可使用auto_ptr,但unique_ptr是更好的选择。如果你的编译器没有unique_ptr,可考虑使用Boost库提供的scoped_ptr,它与unique_ptr类似。

 全文完

C++智能指针简单剖析