首页 > 代码库 > OpenCV源码之内存分配-指针对齐

OpenCV源码之内存分配-指针对齐

首先,为什么要指针对齐(Pointer Alignment)?

指针对齐有时候非常重要,因为许多硬件相关的东西在对齐上存在限制。在有些系统中,某种数据类型只能存储在偶数边界的地址处。

例如,在经典的 SPARC架构(以及经典的ARM)上,你不能从奇数地址读取一个超过1字节的整型数据。尝试这么做将会立即终止程序,并伴随着总线错误。而在X86架构上,CPU硬件处理了这个问题,只是这么做将会花费更多时间;通常RISC架构是不会为你做这些。举例如下:

char c;
char *Pc = &c;
int *Pi;

Pi = (int *)Pc;

你可能会发现,*Pi的引用将会导致错误,因为Pc没有指向一个以"int"型边界对齐的数据项。


OpenCV2.0以上版本很多指针都是被对齐过的,使指针地址能够被16整除。OpenCV中的内存一般是通过malloc分配,不能保证申请的首地址都是都能被16整除;所以OpenCV中需要申请的内存做一些指针对齐操作。OpenCV中内存分配-指针对齐相关的函数有:

void* fastMalloc( size_t size )
{
    uchar* udata = http://www.mamicode.com/(uchar*)malloc(size + sizeof(void*) + CV_MALLOC_ALIGN);>
这里的CV_MALLOC_ALIGN值为16,表示实际存储数据的首地址是16的倍数;多申请的sizeof(void *)空间用来存储malloc返回的内存首地址,以便在fastFree()中可以正确释放。假设要申请的有效内存大小为x字节,即size = x;

我的系统是32位,因此sizeof(void *) = 4,下面以图解的方式讲解以上内存申请过程:

这里ptr = (uchar **)udata + 1;即是alignPtr()函数中的第一个参数,alignPtr()函数定义为:

template<typename _Tp> static inline _Tp* alignPtr(_Tp* ptr, int n=(int)sizeof(_Tp))
{
    return (_Tp*)(((size_t)ptr + n-1) & -n);
}
该函数是用来将ptr指向的地址对齐到n边界,使得到的地址是n的倍数,在这里n = CV_MALLOCD_ALIGN = 16;

ptr = 0xYY YY YY YY,那么ptr +n - 1计算如下:

  0xYY YY YY YY

+                     0F

-------------------------------

当ptr的低4位不全为0时,ptr + n - 1的结果中第5位将会进一。

然后再与(-n)相与,-n == 0xF0,所以最终返回的地址形式为0xYY YY YY Y0,即为CV_MALLOCD_ALIGN = 16的倍数。

例如,(size_t)ptr == 0或16或32 ... ...,即16的整数倍,那么返回的地址就是本身;但如果(size_t)ptr == 2,则返回的地址就是16,如果是18,则返回的地址就是32。


下面以图解的形式分别举例说明,以上分配过程。

当(size_t)ptr % CV_MALLOCD_ALIGN == 15时,

那么对齐后的地址adata相对于ptr有一个偏移量,偏移量为1;然后adata[-1] = udata,就是将malloc返回的首地址给存起来,这段空间也就是malloc时多申请的sizeof(void *)大小的空间。


当(size_t)ptr % CV_MALLOCD_ALIGN == 1时,

那么对齐后的地址adata相对于ptr有一个偏移量,偏移量为15;

fastMalloc返回的地址是adata,而由adata是很容易求出malloc返回的udata,因此fastFree(adata)中就是这样由adata求出udata,从而顺利释放内存。

采用fastMalloc()申请的内存有效利用率为


所以申请的内存块越大,其有效利用率就越大。


另外,其实在GNU系统中,由malloc或realloc返回的内存块的地址总是8的倍数(或者在64位系统上16倍);如果你需要一内存块,其地址是2的更高次幂的倍数,那么可以用stdlib.h.文件中声明的aligned_allocposix_memalign


参考资料:

http://stackoverflow.com/questions/4322926/what-exactly-is-an-aligned-pointer

http://bytes.com/topic/c/answers/213142-what-pointer-alignment

http://www.cnblogs.com/summerRQ/articles/2408767.html

http://www.gnu.org/savannah-checkouts/gnu/libc/manual/html_node/Aligned-Memory-Blocks.html