首页 > 代码库 > 程序故障分析coredump

程序故障分析coredump

一:使用coredump故障分析工具的原因:

core文件:a core file or core dump is a file that records the memory iimage of a running process and               its process status  (register values etc ....)

当一个进程崩溃时,在该进程会在指定目录生成一个core文件 用来记录该进程崩溃时的内存映像,并附带了一些调试信息。该文件主要供   调试使用。通常情况下,core文件会包含了程序运行时的内存,寄存器状态,堆栈指针,内存管理信息还 有各种函数调用堆栈信息等,我们可以理解为是程序工作当前状态存储生成第一个文件,许多的程序出错的时候都会产生一个core文件,通过工具分析这个文件,我们可以定位到程序异常退出的时候对应的堆栈调用等信息,找出问题所在并进行及时解决。


二:coredump产生的几种可能情况

造成程序coredump的原因有很多,这里总结一些比较常用的经验吧:

 1,内存访问越界

  a) 由于使用错误的下标,导致数组访问越界。

  b) 搜索字符串时,依靠字符串结束符来判断字符串是否结束,但是字符串没有正常的使用结束符。

  c) 使用strcpy, strcat, sprintf, strcmp,strcasecmp等字符串操作函数,将目标字符串读/写爆。应该使用strncpy, strlcpy, strncat, strlcat, snprintf, strncmp, strncasecmp等函数防止读写越界。

 2,多线程程序使用了线程不安全的函数。

应该使用下面这些可重入的函数,它们很容易被用错:

asctime_r(3c) gethostbyname_r(3n) getservbyname_r(3n)ctermid_r(3s) gethostent_r(3n) getservbyport_r(3n) ctime_r(3c) getlogin_r(3c)getservent_r(3n) fgetgrent_r(3c) getnetbyaddr_r(3n) getspent_r(3c)fgetpwent_r(3c) getnetbyname_r(3n) getspnam_r(3c) fgetspent_r(3c)getnetent_r(3n) gmtime_r(3c) gamma_r(3m) getnetgrent_r(3n) lgamma_r(3m) getauclassent_r(3)getprotobyname_r(3n) localtime_r(3c) getauclassnam_r(3) etprotobynumber_r(3n)nis_sperror_r(3n) getauevent_r(3) getprotoent_r(3n) rand_r(3c) getauevnam_r(3)getpwent_r(3c) readdir_r(3c) getauevnum_r(3) getpwnam_r(3c) strtok_r(3c) getgrent_r(3c)getpwuid_r(3c) tmpnam_r(3s) getgrgid_r(3c) getrpcbyname_r(3n) ttyname_r(3c)getgrnam_r(3c) getrpcbynumber_r(3n) gethostbyaddr_r(3n) getrpcent_r(3n)

 3,多线程读写的数据未加锁保护。

对于会被多个线程同时访问的全局数据,应该注意加锁保护,否则很容易造成coredump

 4,非法指针

  a) 使用空指针

  b) 随意使用指针转换。一个指向一段内存的指针,除非确定这段内存原先就分配为某种结构或类型,或者这种结构或类型的数组,否则不要将它转换为这种结构或类型的指针,而应该将这段内存拷贝到一个这种结构或类型中,再访问这个结构或类型。这是因为如果这段内存的开始地址不是按照这种结构或类型对齐的,那么访问它时就很容易因为bus error而core dump。

 5,堆栈溢出

不要使用大的局部变量(因为局部变量都分配在栈上),这样容易造成堆栈溢出,破坏系统的栈和堆结构,导致出现莫名其妙的错误。   


 6、修改只读内存等错误


三、Core Dump使能

在linux系统下,Core Dump功能默认是关闭的,

打开的命令::ulimit -c unlimited

关闭命令:    ulimit -c 0(是零)

四、使用方法

发生core dump之后, 可以使用gdb进行查看core文件的内容, 以定位程序出错的位置.

用法: gdb 程序名core文件名

例:   gdb ./hello core.xxxx    (提示:在没有执行该命令之前,一定还要记住加 -g 即gcc -g hello.c -o hello)

补充:"程序core dump掉了,需要定位解决":这里说的大部分是指对应程序由于各种异常或者bug导致在运行过程中异常退出或者中止



本文部分内容转自: http://blog.chinaunix.net/uid-27033491-id-3329952.html

                   http://blog.csdn.net/tenfyguo/article/details/8159176