一个空的class:如
class X{} ;
sizeof(X)==1;
sizeof为什么为1,他有一个隐晦的1 byte,那是被编译器安插进去的一个char,这使得class2的两个objects得以在内存中配置独一无二的地址:
X a,b;
if(&a==&b) cerr<<"yipes!"<<endl;
class X{};
class Y:public virtual X{};
class Z:public virtual X{};
class A:public Y,public Z{};
cout<<"sizeof(X):"<<sizeof(X)<<endl;
cout<<"sizeof(Y):"<<sizeof(Y)<<endl;
cout<<"sizeof(Z):"<<sizeof(Z)<<endl;
cout<<"sizeof(A):"<<sizeof(A)<<endl;
我的vs结果是1 ,4,4,8.
但是让人搞不懂的是Y、Z的大小。主要大小受三个因素的影响:
- 语言本身所造成的额外负担,当语言支持虚基类virtual base class的时候,就导致一个额外的负担,这个一般反映在某种形式的指针身上,它或者指向virtual base class subobject,或者指向一个相关表格。
- 编译器对于特殊情况所提供的优化处理,因为class X有1 byte的大小,这样就出现在了class Y和class Z身上。这个主要视编译器而定,比如某些存在这个1byte但是有些编译器就将他忽略了(因为已经用虚指针了所以这个1byte就可以不用作为内存中的一个定位)。这种情况是对empty virtual base的特殊处理,如VS。
- Alignment的限制,就是所谓的对齐操作,比如你现在占用5bytes编译器为了更有效率地在内存中存取就将其对齐为8byte。
- 下面说明在vs2010中的模型,因为有了虚指针后所以1byte就不用了,所以class Y和class Z的大小就是4bytes,如下图:
现在你觉得class A的大小应该是多少呢?一个虚基类子对象只会在派生类中存在一份实体,不管他在继承体系中出现多少次,所以公用一个1byte的classX实体,再加上class Y和class Z这样就有9bytes,如果有对齐的话就是12bytes但是vs2010中省略了那1byte所以就不存在对齐就直接是8bytes。谜底终于揭开了!!!
Data Member的绑定:the binding of a data member
Data Member的布局
类的static data member会放在程序的数据段(data segment)。
c++ standard要求,在同一个access section中,member的排列只需符合”较晚出现的members在class object中有较高的地址“这一条件即可。也就是说,各个members并不一定得连续排列。什么东西可能会介于被声明的members之间呢?members的边界调整(alignment)可能就需要填补一些bytes。
不同的access section的数据们放置没有强制的前后关系。vptr的放置也没有强制规定。
Data Member的存取
1)对于static data member,
每次程序取用static member,就会被内部转换为对该唯一的extern实体的直接参考操作。存取static members并不需要通过class object。对于继承而来的static member其存取路径也是同样直接。(因为static members只存在唯一的一份实体)
(如何有2个classes,每一个都声明了一个static member freelist;那么都被放在程序的data segment时,就会导致冲突,编译器的解决办法是暗中对每一个static data member编码(name-mangling),以获得一个独一无二的程序识别代码。任何name-mangline都有2个要点:
1.一种算法,推导出独一无二的名称
2.独一无二的名称可以轻易被推导回原来的名称。
(2)对于nonstatic data member,
每一个nonstatic data member的偏移量offset,在编译时期即可获知。(派生自单一或多重继承串链也一样)。
而当虚继承时,虚继承将为“经由base class subobject 存取 class members”导入一层新的间接性。
(2)对于nonstatic data member,
每一个nonstatic data member的偏移量offset,在编译时期即可获知。(派生自单一或多重继承串链也一样)。
nonstatic data member直接存放在class object之中,除非经由明确explicti或暗喻的implicit的class object,没有办法直接存取他们。只要程序员在一个member function直接处理一个nonstatic data member,所谓的”implicit class object“就会发生。例如:
Point3D Point3D::translate(const Point3D &pt){
x+=pt.x;
y+=pt.y;
z+=pt.z;
}
表面上所看到的对于x,y,z的直接存取,事实上是经由一个”implicit class object“(有this指针表达)完成,事实上这个函数的参数是:
Point3D Point3D::translate(Point3d * const thisconst Point3D &pt){
this->x+=pt.x;
this-> y+=pt.y;
this->z+=pt.z;
}
欲对一个nonstatic data member进行存取操作,编译器需要把class object的起始地址加上data member的偏移量(offset)。
举个例子,如:
class Point3d{
public:
//..
private:
float x;
static List<Point#d*> *freeList;
float y;
static const int chunkSize=250;
float z;
}
Point3d orgin;
origin._y=0.0;
那么地址&origin._y将等于
&origin+(&Point3d::_y-1);
请注意-1操作,指向data member的指针,其offset值总是被加上1,这样可以是编译系统区分出”一个指向data member的指针,用以指出class的第一个member”和“一个指向data member的指针,没有指出任何member”两种情况。
每一个nonstatic data member的偏移量(offset)在编译时期即可货值,甚至一个member属于一个base class subobject(派生自单一或多重继承串链)也是一样,因此,存放一个nonstatic data member,其效率和存取一个c struct member或一个nondervied class的member是一样的。
必须通过对象才能访问nonstatic data member(要不然访问的是谁的data member呢)。方法为对象的地址加上data member的offset就是这个data member的地址。
但在有虚拟继承的情况下,由于“经由base class subject存取class member”导入一层新的间接性,访问的时候,会有不同。考虑如下代码:
Point3d origin, *pt;
origin.x = 0;
pt->x;
由于origin一定是Point3d类型,所以origin.x编译时即可确定其offset。
从origin和pt存取有何差异?
答:当Point3d是一个derived class,而在其继承结构中有一个virtual base class,并且被存取的member是一个从该virtual base class继承而来的member时,有差异。
从pt存取,这时我们不知道pt指向哪一种class type,即无法知道编译时期这个member真正的offset位置,这个存取操作必须延迟至执行期,经由一个额外的间接引导,才能够解决。存取速度比较慢一些。从origin存取,origin的类型是明确的,members的offset位置在编译时期就固定了
继承与Data Member
在c++继承模型中,一个dervied class object所表现的东西,是其自己的member是加上其base class member的总和。在大部分编译器中,base class member总是先出现,但属于virtual base class的除外(一般而言,任何规则一旦碰上virtual base class就没辙了,这里也不例外)。