首页 > 代码库 > 程序故障分析coredump
程序故障分析coredump
一:使用coredump故障分析工具的原因:
core文件:a core file or core dump is a file that records the memory iimage of a running process and its process status (register values etc ....)
当一个进程崩溃时,在该进程会在指定目录生成一个core文件 用来记录该进程崩溃时的内存映像,并附带了一些调试信息。该文件主要供 调试使用。通常情况下,core文件会包含了程序运行时的内存,寄存器状态,堆栈指针,内存管理信息还 有各种函数调用堆栈信息等,我们可以理解为是程序工作当前状态存储生成第一个文件,许多的程序出错的时候都会产生一个core文件,通过工具分析这个文件,我们可以定位到程序异常退出的时候对应的堆栈调用等信息,找出问题所在并进行及时解决。
二:coredump产生的几种可能情况
造成程序coredump的原因有很多,这里总结一些比较常用的经验吧:
1,内存访问越界
a) 由于使用错误的下标,导致数组访问越界。
b) 搜索字符串时,依靠字符串结束符来判断字符串是否结束,但是字符串没有正常的使用结束符。
c) 使用strcpy, strcat, sprintf, strcmp,strcasecmp等字符串操作函数,将目标字符串读/写爆。应该使用strncpy, strlcpy, strncat, strlcat, snprintf, strncmp, strncasecmp等函数防止读写越界。
2,多线程程序使用了线程不安全的函数。
应该使用下面这些可重入的函数,它们很容易被用错:
asctime_r(3c) gethostbyname_r(3n) getservbyname_r(3n)ctermid_r(3s) gethostent_r(3n) getservbyport_r(3n) ctime_r(3c) getlogin_r(3c)getservent_r(3n) fgetgrent_r(3c) getnetbyaddr_r(3n) getspent_r(3c)fgetpwent_r(3c) getnetbyname_r(3n) getspnam_r(3c) fgetspent_r(3c)getnetent_r(3n) gmtime_r(3c) gamma_r(3m) getnetgrent_r(3n) lgamma_r(3m) getauclassent_r(3)getprotobyname_r(3n) localtime_r(3c) getauclassnam_r(3) etprotobynumber_r(3n)nis_sperror_r(3n) getauevent_r(3) getprotoent_r(3n) rand_r(3c) getauevnam_r(3)getpwent_r(3c) readdir_r(3c) getauevnum_r(3) getpwnam_r(3c) strtok_r(3c) getgrent_r(3c)getpwuid_r(3c) tmpnam_r(3s) getgrgid_r(3c) getrpcbyname_r(3n) ttyname_r(3c)getgrnam_r(3c) getrpcbynumber_r(3n) gethostbyaddr_r(3n) getrpcent_r(3n)
3,多线程读写的数据未加锁保护。
对于会被多个线程同时访问的全局数据,应该注意加锁保护,否则很容易造成coredump
4,非法指针
a) 使用空指针
b) 随意使用指针转换。一个指向一段内存的指针,除非确定这段内存原先就分配为某种结构或类型,或者这种结构或类型的数组,否则不要将它转换为这种结构或类型的指针,而应该将这段内存拷贝到一个这种结构或类型中,再访问这个结构或类型。这是因为如果这段内存的开始地址不是按照这种结构或类型对齐的,那么访问它时就很容易因为bus error而core dump。
5,堆栈溢出
不要使用大的局部变量(因为局部变量都分配在栈上),这样容易造成堆栈溢出,破坏系统的栈和堆结构,导致出现莫名其妙的错误。
6、修改只读内存等错误
三、Core Dump使能
在linux系统下,Core Dump功能默认是关闭的,
打开的命令::ulimit -c unlimited
关闭命令: ulimit -c 0(是零)
四、使用方法
发生core dump之后, 可以使用gdb进行查看core文件的内容, 以定位程序出错的位置.
用法: gdb 程序名core文件名
例: gdb ./hello core.xxxx (提示:在没有执行该命令之前,一定还要记住加 -g 即gcc -g hello.c -o hello)
补充:"程序core dump掉了,需要定位解决":这里说的大部分是指对应程序由于各种异常或者bug导致在运行过程中异常退出或者中止
本文部分内容转自: http://blog.chinaunix.net/uid-27033491-id-3329952.html
http://blog.csdn.net/tenfyguo/article/details/8159176