首页 > 代码库 > OpenCV源码之内存分配-指针对齐
OpenCV源码之内存分配-指针对齐
首先,为什么要指针对齐(Pointer Alignment)?
指针对齐有时候非常重要,因为许多硬件相关的东西在对齐上存在限制。在有些系统中,某种数据类型只能存储在偶数边界的地址处。
例如,在经典的 SPARC架构(以及经典的ARM)上,你不能从奇数地址读取一个超过1字节的整型数据。尝试这么做将会立即终止程序,并伴随着总线错误。而在X86架构上,CPU硬件处理了这个问题,只是这么做将会花费更多时间;通常RISC架构是不会为你做这些。举例如下:
char c; char *Pc = &c; int *Pi; Pi = (int *)Pc;
你可能会发现,*Pi的引用将会导致错误,因为Pc没有指向一个以"int"型边界对齐的数据项。
OpenCV2.0以上版本很多指针都是被对齐过的,使指针地址能够被16整除。OpenCV中的内存一般是通过malloc分配,不能保证申请的首地址都是都能被16整除;所以OpenCV中需要申请的内存做一些指针对齐操作。OpenCV中内存分配-指针对齐相关的函数有:
void* fastMalloc( size_t size ) { uchar* udata = http://www.mamicode.com/(uchar*)malloc(size + sizeof(void*) + CV_MALLOC_ALIGN);>
这里的CV_MALLOC_ALIGN值为16,表示实际存储数据的首地址是16的倍数;多申请的sizeof(void *)空间用来存储malloc返回的内存首地址,以便在fastFree()中可以正确释放。假设要申请的有效内存大小为x字节,即size = x;我的系统是32位,因此sizeof(void *) = 4,下面以图解的方式讲解以上内存申请过程:
这里ptr = (uchar **)udata + 1;即是alignPtr()函数中的第一个参数,alignPtr()函数定义为:
template<typename _Tp> static inline _Tp* alignPtr(_Tp* ptr, int n=(int)sizeof(_Tp)) { return (_Tp*)(((size_t)ptr + n-1) & -n); }该函数是用来将ptr指向的地址对齐到n边界,使得到的地址是n的倍数,在这里n = CV_MALLOCD_ALIGN = 16;ptr = 0xYY YY YY YY,那么ptr +n - 1计算如下:
0xYY YY YY YY
+ 0F
-------------------------------
当ptr的低4位不全为0时,ptr + n - 1的结果中第5位将会进一。
然后再与(-n)相与,-n == 0xF0,所以最终返回的地址形式为0xYY YY YY Y0,即为CV_MALLOCD_ALIGN = 16的倍数。
例如,(size_t)ptr == 0或16或32 ... ...,即16的整数倍,那么返回的地址就是本身;但如果(size_t)ptr == 2,则返回的地址就是16,如果是18,则返回的地址就是32。
下面以图解的形式分别举例说明,以上分配过程。
当(size_t)ptr % CV_MALLOCD_ALIGN == 15时,
那么对齐后的地址adata相对于ptr有一个偏移量,偏移量为1;然后adata[-1] = udata,就是将malloc返回的首地址给存起来,这段空间也就是malloc时多申请的sizeof(void *)大小的空间。
当(size_t)ptr % CV_MALLOCD_ALIGN == 1时,
那么对齐后的地址adata相对于ptr有一个偏移量,偏移量为15;
fastMalloc返回的地址是adata,而由adata是很容易求出malloc返回的udata,因此fastFree(adata)中就是这样由adata求出udata,从而顺利释放内存。
采用fastMalloc()申请的内存有效利用率为
所以申请的内存块越大,其有效利用率就越大。
另外,其实在GNU系统中,由malloc或realloc返回的内存块的地址总是8的倍数(或者在64位系统上16倍);如果你需要一内存块,其地址是2的更高次幂的倍数,那么可以用stdlib.h.文件中声明的
aligned_alloc
、posix_memalign
。
参考资料:
http://stackoverflow.com/questions/4322926/what-exactly-is-an-aligned-pointer
http://bytes.com/topic/c/answers/213142-what-pointer-alignment
http://www.cnblogs.com/summerRQ/articles/2408767.html
http://www.gnu.org/savannah-checkouts/gnu/libc/manual/html_node/Aligned-Memory-Blocks.html