首页 > 代码库 > C++ 虚函数表解析

C++ 虚函数表解析

C++ 虚函数表解析 http://blog.csdn.net/haoel/article/details/1948051

C++中虚函数工作原理和(虚)继承类的内存占用大小计算 http://blog.csdn.net/hackbuteer1/article/details/7883531

C++虚函数及虚函数表解析 http://www.perfect-is-shit.com/cpp-vtable.html

 

声明:

本文内容由自互联网资源(见参考资料)、个人的一些 C++ 学习感悟、个人实践整理而成。文章仅以技术学习和交流为目的。如果您发现了文中的错误,或者您有的不同的见解,可以给我留言或者给我发邮件,我们共同探讨。如果您觉得我的文章侵犯到您的权益,请联系我(chinajiezhang@gmail.com),以便我做相应的处理。最后,如需转载,可不必标明出处。但一定要全文转载,保证参考链接的完整性,这是对别人写作的基本尊重。谢谢合作!

写博缘由:

  • 对C++多态内部机制了解的渴望;
  • 眼过千遍,不如手过一遍;
  • 整理成文,帮助自己记忆;不求帮到他人,只求不会误导。

一、背景知识(一些基本概念)

虚函数(Virtual Function):在基类中声明为 virtual 并在一个或多个派生类中被重新定义的成员函数。

纯虚函数(Pure Virtual Function):基类中没有实现体的虚函数称为纯虚函数(有纯虚函数的基类称为虚基类)。 C++ “虚函数”的存在是为了实现面向对象中的“多态”,即父类类别的指针(或者引用)指向其子类的实例,然后通过父类的指针(或者引用)调用实际子类的成员函数。通过动态赋值,实现调用不同的子类的成员函数(动态绑定)。正是因为这种机制,把析构函数声明为“虚函数”可以防止在内存泄露。

实例:

#include <iostream>using namespace std;class base_class{public:    base_class()    {    }    virtual ~base_class()    {    }    int normal_func()    {        cout << "This is  base_class‘s normal_func()" << endl;        return 0;    }    virtual int virtual_fuc()    {        cout << "This is  base_class‘s virtual_fuc()" << endl;        return 0;    }};class drived_class1 : public base_class{public:    drived_class1()    {    }    virtual ~drived_class1()    {    }    int normal_func()    {        cout << "This is  drived_class1‘s normal_func()" << endl;        return 0;    }    virtual int virtual_fuc()    {        cout << "This is  drived_class1‘s virtual_fuc()" << endl;        return 0;    }};class drived_class2 : public base_class{public:    drived_class2()    {    }    virtual ~drived_class2()    {    }    int normal_func()    {        cout << "This is  drived_class2‘s normal_func()" << endl;        return 0;    }    virtual int virtual_fuc()    {        cout << "This is  drived_class2‘s virtual_fuc()" << endl;        return 0;    }};int main(){    base_class * pbc = NULL;    base_class bc;    drived_class1 dc1;    drived_class2 dc2;    pbc = &bc;    pbc->normal_func();    pbc->virtual_fuc();    pbc = &dc1;    pbc->normal_func();    pbc->virtual_fuc();    pbc = &dc2;    pbc->normal_func();    pbc->virtual_fuc();    return 0;}

输出结果:

This is  base_classs normal_func()This is  base_classs virtual_fuc()This is  base_classs normal_func()This is  drived_class1s virtual_fuc()This is  base_classs normal_func()This is  drived_class2s virtual_fuc()

假如将 base_class 类中的 virtual_fuc() 写成下面这样(纯虚函数,虚基类):

// 无实现体virtual int virtual_fuc() = 0;

那么 virtual_fuc() 是一个纯虚函数,base_class 就是一个虚基类:不能实例化(即不能用它来定义对象),只能声明指针或者引用。读者可以自行测试,这里不再给出实例。

虚函数表(Virtual Table,V-Table):使用 V-Table 实现 C++ 的多态。在这个表中,主要是一个类的虚函数的地址表,这张表解决了继承、覆盖的问题,保证其真实反应实际的函数。这样,在有虚函数的类的实例中分配了指向这个表的指针的内存,所以,当用父类的指针来操作一个子类的时候,这张虚函数表就显得尤为重要了,它就像一个地图一样,指明了实际所应该调用的函数。

编译器应该保证虚函数表的指针存在于对象实例中最前面的位置(这是为了保证取到虚函数表的有最高的性能——如果有多层继承或是多重继承的情况下)。

这意味着可以通过对象实例的地址得到这张虚函数表,然后就可以遍历其中函数指针,并调用相应的函数。

二、无继承时的虚函数表

#include <iostream>using namespace std;class base_class{public:    virtual void v_func1()    {        cout << "This is base_class‘s v_func1()" << endl;    }    virtual void v_func2()    {        cout << "This is base_class‘s v_func2()" << endl;    }    virtual void v_func3()    {        cout << "This is base_class‘s v_func3()" << endl;    }};int main(){    // 查看 base_class 的虚函数表    base_class bc;    cout << "base_class 的虚函数表首地址为:" << (int*)&bc << endl; // 虚函数表地址存在对象的前四个字节    cout << "base_class 的 第一个函数首地址:" << (int*)*(int*)&bc+0 << endl; // 指针运算看不懂?没关系,一会解释给你听    cout << "base_class 的 第二个函数首地址:" << (int*)*(int*)&bc+1 << endl;    cout << "base_class 的 第三个函数首地址:" << (int*)*(int*)&bc+2 << endl;    cout << "base_class 的 结束标志: " << *((int*)*(int*)&bc+3) << endl;    // 通过函数指针调用函数,验证正确性    typedef void(*func_pointer)(void);    func_pointer fp = NULL;    fp = (func_pointer)*((int*)*(int*)&bc+0); // v_func1()    fp();    fp = (func_pointer)*((int*)*(int*)&bc+1); // v_func2()    fp();    fp = (func_pointer)*((int*)*(int*)&bc+2); // v_func3()    fp();    return 0;}

输出结果:

base_class 的虚函数表首地址为:0x22ff0cbase_class 的 第一个函数首地址:0x472c98base_class 的 第二个函数首地址:0x472c9cbase_class 的 第三个函数首地址:0x472ca0base_class 的虚函数表结束标志: 0This is base_classs v_func1()This is base_classs v_func2()This is base_classs v_func3()

简单的解释一下代码中的指针转换:

  • &bc:获得 bc 对象的地址。
  • (int)&bc: 类型转换,获得虚函数表的首地址。这里使用 int 的原因是函数指针的大小的 4byte,使用 int 可以使得他们每次的偏移量保持一致(sizeof(int) = 4,32-bit机器)。
  • (int)&bc:解指针引用,获得虚函数表。
  • (int)(int*)&bc+0:和上面相同的类型转换,获得虚函数表的第一个虚函数地址。
  • (int)(int*)&bc+1:同上,获得第二个函数地址。
  • (int)(int*)&bc+2:同上,获得第三个函数地址。
  • ((int)(int)&bc+3):获得虚函数表的结束标志,所以这里我解引用了。和我们使用链表的情况是一样的,虚函数表当然也需要一个结束标志。
  • typedef void(*func_pointer)(void):定义一个函数指针,参数和返回值都是 void。

对于指针的转换,我就解释这么多了。下面的文章,我不再做解释,相信大家可以举一反三。如果你觉得很费解的话,我不建议继续去看这篇文章了,建议你去补一补基础(《C和指针》是一本很好的选择哦!)。 通过上面的例子的尝试和输出结果,我们可以得出下面的布局图示:

三、单一继承下的虚函数表

3.1 子类没有重写父类的虚函数

(陈皓文章中用了“覆盖”一词,我觉得太合理,但是我又找不到更合理的词语,所以就用一个句子代替了。^-^)

#include <iostream>using namespace std;class base_class{public:    virtual void v_func1()    {        cout << "This is base_class‘s v_func1()" << endl;    }    virtual void v_func2()    {        cout << "This is base_class‘s v_func2()" << endl;    }    virtual void v_func3()    {        cout << "This is base_class‘s v_func3()" << endl;    }};class dev_class : public base_class{public:    virtual void v_func4()    {        cout << "This is dev_class‘s v_func4()" << endl;    }    virtual void v_func5()    {        cout << "This is dev_class‘s v_func5()" << endl;    }};int main(){    // 查看 dev_class 的虚函数表    dev_class dc;    cout << "dev_class 的虚函数表首地址为:" << (int*)&dc << endl;    cout << "dev_class 的 第一个函数首地址:" << (int*)*(int*)&dc+0 << endl;    cout << "dev_class 的 第二个函数首地址:" << (int*)*(int*)&dc+1 << endl;    cout << "dev_class 的 第三个函数首地址:" << (int*)*(int*)&dc+2 << endl;    cout << "dev_class 的 第四个函数首地址:" << (int*)*(int*)&dc+3 << endl;    cout << "dev_class 的 第五个函数首地址:" << (int*)*(int*)&dc+4 << endl;    cout << "dev_class 的虚函数表结束标志: " << *((int*)*(int*)&dc+5) << endl;    // 通过函数指针调用函数,验证正确性    typedef void(*func_pointer)(void);    func_pointer fp = NULL;    for (int i=0; i<5; i++) {        fp = (func_pointer)*((int*)*(int*)&dc+i);        fp();    }    return 0;}

输出结果:

dev_class 的虚函数表首地址为:0x22ff0cdev_class 的 第一个函数首地址:0x472d10dev_class 的 第二个函数首地址:0x472d14dev_class 的 第三个函数首地址:0x472d18dev_class 的 第四个函数首地址:0x472d1cdev_class 的 第五个函数首地址:0x472d20dev_class 的虚函数表结束标志: 0This is base_classs v_func1()This is base_classs v_func2()This is base_classs v_func3()This is dev_classs v_func4()This is dev_classs v_func5()

通过上面的例子的尝试和输出结果,我们可以得出下面的布局图示:

可以看出,v-table中虚函数是顺序存放的,先基类后派生类。

3.2 子类有重写父类的虚函数

#include <iostream>using namespace std;class base_class{public:    virtual void v_func1()    {        cout << "This is base_class‘s v_func1()" << endl;    }    virtual void v_func2()    {        cout << "This is base_class‘s v_func2()" << endl;    }    virtual void v_func3()    {        cout << "This is base_class‘s v_func3()" << endl;    }};class dev_class : public base_class{public:    virtual void v_func1()    {        cout << "This is dev_class‘s v_func1()" << endl;    }    virtual void v_func2()    {        cout << "This is dev_class‘s v_func2()" << endl;    }    virtual void v_func4()    {        cout << "This is dev_class‘s v_func4()" << endl;    }    virtual void v_func5()    {        cout << "This is dev_class‘s v_func5()" << endl;    }};int main(){    // 查看 dev_class 的虚函数表    dev_class dc;    cout << "dev_class 的虚函数表首地址为:" << (int*)&dc << endl;    cout << "dev_class 的 第一个函数首地址:" << (int*)*(int*)&dc+0 << endl;    cout << "dev_class 的 第二个函数首地址:" << (int*)*(int*)&dc+1 << endl;    cout << "dev_class 的 第三个函数首地址:" << (int*)*(int*)&dc+2 << endl;    cout << "dev_class 的 第四个函数首地址:" << (int*)*(int*)&dc+3 << endl;    cout << "dev_class 的 第五个函数首地址:" << (int*)*(int*)&dc+4 << endl;    cout << "dev_class 的虚函数表结束标志: " << *((int*)*(int*)&dc+5) << endl;    // 通过函数指针调用函数,验证正确性    typedef void(*func_pointer)(void);    func_pointer fp = NULL;    for (int i=0; i<5; i++) {        fp = (func_pointer)*((int*)*(int*)&dc+i);        fp();    }    return 0;}

输出结果:

dev_class 的虚函数表首地址为:0x22ff0cdev_class 的 第一个函数首地址:0x472d50dev_class 的 第二个函数首地址:0x472d54dev_class 的 第三个函数首地址:0x472d58dev_class 的 第四个函数首地址:0x472d5cdev_class 的 第五个函数首地址:0x472d60dev_class 的虚函数表结束标志: 0This is dev_classs v_func1()This is dev_classs v_func2()This is base_classs v_func3()This is dev_classs v_func4()This is dev_classs v_func5()

通过上面的例子的尝试和输出结果,我们可以得出下面的布局图示:

可以看出:当派生类中 dev_class 中重写了父类 base_class 的前两个虚函数(v_func1,v_func2)之后,使用派生类的虚函数指针代替了父类的虚函数。未重写的父类虚函数位置没有发生变化。

不知道看到这里,你心里有没有一个小问题?至少我是有的。看下面的代码:

virtual void v_func1(){    base_class::v_func1();    cout << "This is dev_class‘s v_func1()" << endl;}

既然派生类的虚函数表中用 dev_class::v_func1 指针代替了 base_class::v_func1,假如我显示的调用

base_class::v_func1,会不会有错呢?答案是没错的,可以正确的调用!不是覆盖了吗?dev_class 已经不知道 base_class::v_func1 的指针了,怎么调用的呢?

如果你想知道原因,请关注这两个帖子:

  • http://stackoverflow.com/questions/11426970/why-can-a-derived-class-virtual-function-call-a-base-class-virtual-fuction-how
  • http://topic.csdn.net/u/20120711/14/fa9cfba2-8814-4119-8290-99e6af2c21f4.html?seed=742904136&r=79093804#r_79093804

四、多重继承下的虚函数表

4.1子类没有重写父类的虚函数

#include <iostream>using namespace std;class base_class1{public:    virtual void bc1_func1()    {        cout << "This is bc1_func1‘s v_func1()" << endl;    }};class base_class2{public:    virtual void bc2_func1()    {        cout << "This is bc2_func1‘s v_func1()" << endl;    }};class dev_class : public base_class1, public base_class2{public:    virtual void dc_func1()    {        cout << "This is dc_func1‘s dc_func1()" << endl;    }};int main(){    dev_class dc;    cout << "dc 的虚函数表 bc1_vt 地址:" << (int*)&dc << endl;    cout << "dc 的虚函数表 bc1_vt 第一个虚函数地址:" << (int*)*(int*)&dc+0 << endl;    cout << "dc 的虚函数表 bc1_vt 第二个虚函数地址:" << (int*)*(int*)&dc+1 << endl;    cout << "dc 的虚函数表 bc1_vt 结束标志:" << *((int*)*(int*)&dc+2) << endl;    cout << "dc 的虚函数表 bc2_vt 地址:" << (int*)&dc+1 << endl;    cout << "dc 的虚函数表 bc2_vt 第一个虚函数首地址::" << (int*)*((int*)&dc+1)+0 << endl;    cout << "dc 的虚函数表 bc2_vt 结束标志:" << *((int*)*((int*)&dc+1)+1) << endl;    // 通过函数指针调用函数,验证正确性    typedef void(*func_pointer)(void);    func_pointer fp = NULL;    // bc1_vt    fp = (func_pointer)*((int*)*(int*)&dc+0);    fp();    fp = (func_pointer)*((int*)*(int*)&dc+1);    fp();    // bc2_vt    fp = (func_pointer)*(((int*)*((int*)&dc+1)+0));    fp();    return 0;}

输出结果:

dc 的虚函数表 bc1_vt 地址:0x22ff08dc 的虚函数表 bc1_vt 第一个虚函数地址:0x472d38dc 的虚函数表 bc1_vt 第二个虚函数地址:0x472d3cdc 的虚函数表 bc1_vt 结束标志:-4dc 的虚函数表 bc2_vt 地址:0x22ff0cdc 的虚函数表 bc2_vt 第一个虚函数首地址::0x472d48dc 的虚函数表 bc2_vt 结束标志:0This is bc1_func1s v_func1()This is dc_func1s dc_func1()This is bc2_func1s v_func1()

通过上面的例子的尝试和输出结果,我们可以得出下面的布局图示:

可以看出:多重继承的情况,会为每一个基类建一个虚函数表。派生类的虚函数放到第一个虚函数表的后面。

陈皓在他的文章中有这么一句话:“这个结束标志(虚函数表)的值在不同的编译器下是不同的。在WinXP+VS2003下,这个值是NULL。而在Ubuntu 7.10 + Linux 2.6.22 + GCC 4.1.3下,这个值是如果1,表示还有下一个虚函数表,如果值是0,表示是最后一个虚函数表。”我在 Windows 7 + Code::blocks 10.05 下尝试,这个值是如果是 -4,表示还有下一个虚函数表,如果是0,表示是最后一个虚函数表。我在 Windows 7 + vs2010 下尝试,两个值都是 0 。

4.2子类重写了父类的虚函数

#include <iostream>using namespace std;class base_class1{public:    virtual void bc1_func1()    {        cout << "This is base_class1‘s bc1_func1()" << endl;    }    virtual void bc1_func2()    {        cout << "This is base_class1‘s bc1_func2()" << endl;    }};class base_class2{public:    virtual void bc2_func1()    {        cout << "This is base_class2‘s bc2_func1()" << endl;    }    virtual void bc2_func2()    {        cout << "This is base_class2‘s bc2_func2()" << endl;    }};class dev_class : public base_class1, public base_class2{public:    virtual void bc1_func1()    {        cout << "This is dev_class‘s bc1_func1()" << endl;    }    virtual void bc2_func1()    {        cout << "This is dev_class‘s bc2_func1()" << endl;    }    virtual void dc_func1()    {        cout << "This is dev_class‘s dc_func1()" << endl;    }};int main(){    dev_class dc;    cout << "dc 的虚函数表 bc1_vt 地址:" << (int*)&dc << endl;    cout << "dc 的虚函数表 bc1_vt 第一个虚函数地址:" << (int*)*(int*)&dc+0 << endl;    cout << "dc 的虚函数表 bc1_vt 第二个虚函数地址:" << (int*)*(int*)&dc+1 << endl;    cout << "dc 的虚函数表 bc1_vt 第三个虚函数地址:" << (int*)*(int*)&dc+2 << endl;    cout << "dc 的虚函数表 bc1_vt 第四个虚函数地址:" << (int*)*(int*)&dc+3 << endl;    cout << "dc 的虚函数表 bc1_vt 结束标志:" << *((int*)*(int*)&dc+4) << endl;    cout << "dc 的虚函数表 bc2_vt 地址:" << (int*)&dc+1 << endl;    cout << "dc 的虚函数表 bc2_vt 第一个虚函数首地址::" << (int*)*((int*)&dc+1)+0 << endl;    cout << "dc 的虚函数表 bc2_vt 第二个虚函数首地址::" << (int*)*((int*)&dc+1)+1 << endl;    cout << "dc 的虚函数表 bc2_vt 结束标志:" << *((int*)*((int*)&dc+1)+2) << endl;    // 通过函数指针调用函数,验证正确性    typedef void(*func_pointer)(void);    func_pointer fp = NULL;    // bc1_vt    fp = (func_pointer)*((int*)*(int*)&dc+0);    fp();    fp = (func_pointer)*((int*)*(int*)&dc+1);    fp();    fp = (func_pointer)*((int*)*(int*)&dc+2);    fp();    fp = (func_pointer)*((int*)*(int*)&dc+3);    fp();    // bc2_vt    fp = (func_pointer)*(((int*)*((int*)&dc+1)+0));    fp();    fp = (func_pointer)*(((int*)*((int*)&dc+1)+1));    fp();    return 0;}

输出结果:

dc 的虚函数表 bc1_vt 地址:0x22ff08dc 的虚函数表 bc1_vt 第一个虚函数地址:0x472e28dc 的虚函数表 bc1_vt 第二个虚函数地址:0x472e2cdc 的虚函数表 bc1_vt 第三个虚函数地址:0x472e30dc 的虚函数表 bc1_vt 第四个虚函数地址:0x472e34dc 的虚函数表 bc1_vt 结束标志:-4dc 的虚函数表 bc2_vt 地址:0x22ff0cdc 的虚函数表 bc2_vt 第一个虚函数首地址::0x472e40dc 的虚函数表 bc2_vt 第一个虚函数首地址::0x472e44dc 的虚函数表 bc2_vt 结束标志:0This is dev_classs bc1_func1()This is base_class1s bc1_func2()This is dev_classs bc2_func1()This is dev_classs dc_func1()This is dev_classs bc2_func1()This is base_class2s bc2_func2()

通过上面的例子的尝试和输出结果,我们可以得出下面的布局图示:

是不是感觉很乱?其实一点都不乱!就是两个单继承而已。把多余的部分(派生类的虚函数)增加到第一个虚函数表的最后,CB(Code::Blocks)是这样实现的。我试了一下,vs2010不是这样实现的,读者可以自己尝试一下。本文只针对 CB 来探讨。

有人觉得多重继承不好理解。我想如果你明白了它的虚函数表是怎么样的,也就没什么不好理解了吧。

也许还有人会说,不同的编译器实现方式是不一样的,我去研究某一种编译器的实现有什么意义呢?我个人理解是这样的:

  • 实现方式是不一样的,但是它们的实现结果是一样的(多态)。
  • 无论你了解虚函数表或者不了解虚函数表,我相信你都很少会用到它。但是当你了解了它的实现机制之后,你再去看多态,再去写虚函数的时候[作为你一个coder],相信你的感觉是不一样的。你会感觉很透彻,不会有丝毫的犹豫。
  • 学习编译器这种处理问题的方式(思想),这才是最重要的。[好像扯远了,^-^]。

如果你了解了虚函数表之后,可以通过虚函数表直接访问类的方法,这种访问是不受成员的访问权限限制的(private,protected)。这样做是很危险的,但是确实是可以这样做的。这也是C++为什么很危险的语言的一个原因……

写到这里,文章也就基本结束了。作为读者的你,看完之后,你不是产生了许多其他的问题呢?作为笔者的我,有了新几个问题[我这人问题特别多。^-^]比如:

  • 访问权限是怎么实现的?编译器怎么知道哪些函数是public,哪些是protected?
  • 虚函数调用是通过虚函数表实现的,那么非虚成员函数存放在哪里?是怎么实现的呢?
  • 类的成员存放在什么位置?怎么继承的呢?[这是对象布局问题,=.=]

你知道的越多,你感觉你知道的越少。推荐大家一本书吧,《深度探索C++对象模型》(英文名字是《Inside to C++ Object Model》),看完你会明白很多。


感谢阅读,下面列出参考资料[顺便给大家推荐一下陈皓的博客吧:http://coolshell.cn/,经常去逛逛,会学到很多,至少我是这样觉得的。^-^]:

  • http://blog.csdn.net/haoel/article/details/1948051/
  • http://baike.baidu.com/view/3750123.htm
  • http://www.cnblogs.com/wirelesser/archive/2008/03/09/1097463.html

2012.07.20 update:

  • 本文只针对 Windows 7 Code::blocks 10.05 进行测试和讲解;
  • 不同的编译器实现方式可能不同,比如 VS2010 和 CB 10.05 就有些不同,感兴趣的朋友可自行测试。

C++ 虚函数表解析