首页 > 代码库 > GDB调试多线程

GDB调试多线程


GDB多线程调试的基本命令。


info threads显示当前可调试的所有线程,每个线程会有一个GDB为其分配的ID,后面操作线程的时候会用到这个。 前面有*的是当前调试的线程。
thread ID切换当前调试的线程为指定ID的线程。
break thread_test.c:123 thread all
在所有线程中相应的行上设置断点
thread apply ID1 ID2 command让一个或者多个线程执行GDB命令command。
thread apply all command
让所有被调试线程执行GDB命令command。
set scheduler-locking off|on|step估计是实际使用过多线程调试的人都可以发现,在使用step或者continue命令调试当前被调试线程的时候,其他线程也是同时执行的,怎么只让被调试程序执行呢?通过这个命令就可以实现这个需求。off 不锁定任何线程,也就是所有线程都执行,这是默认值。 on 只有当前被调试程序会执行。 step 在单步的时候,除了next过一个函数的情况(熟悉情况的人可能知道,这其实是一个设置断点然后continue的行为)以外,只有当前线程会执行。

 

gdb对于多线程程序的调试有如下的支持:

  • 线程产生通知:在产生新的线程时, gdb会给出提示信息

(gdb) r
Starting program: /root/thread 
[New Thread 1073951360 (LWP 12900)] 
[New Thread 1082342592 (LWP 12907)]---以下三个为新产生的线程
[New Thread 1090731072 (LWP 12908)]
[New Thread 1099119552 (LWP 12909)]

  • 查看线程:使用info threads可以查看运行的线程。

(gdb) info threads
  4 Thread 1099119552 (LWP 12940)   0xffffe002 in ?? ()
  3 Thread 1090731072 (LWP 12939)   0xffffe002 in ?? ()
  2 Thread 1082342592 (LWP 12938)   0xffffe002 in ?? ()
* 1 Thread 1073951360 (LWP 12931)   main (argc=1, argv=0xbfffda04) at thread.c:21
(gdb)

注意,行首的数字为gdb分配的线程号,对线程进行切换时,使用该该号码。

另外,行首的星号标识了当前活动的线程

  • 切换线程:使用 thread THREADNUMBER 进行切换,THREADNUMBER 为上文提到的线程号。下例显示将活动线程从 1 切换至 4。

(gdb) info threads
   4 Thread 1099119552 (LWP 12940)   0xffffe002 in ?? ()
   3 Thread 1090731072 (LWP 12939)   0xffffe002 in ?? ()
   2 Thread 1082342592 (LWP 12938)   0xffffe002 in ?? ()
* 1 Thread 1073951360 (LWP 12931)   main (argc=1, argv=0xbfffda04) at thread.c:21
(gdb) thread 4
[Switching to thread 4 (Thread 1099119552 (LWP 12940))]#0   0xffffe002 in ?? ()
(gdb) info threads
* 4 Thread 1099119552 (LWP 12940)   0xffffe002 in ?? ()
   3 Thread 1090731072 (LWP 12939)   0xffffe002 in ?? ()
   2 Thread 1082342592 (LWP 12938)   0xffffe002 in ?? ()
   1 Thread 1073951360 (LWP 12931)   main (argc=1, argv=0xbfffda04) at thread.c:21
(gdb)

后面就是直接在你的线程函数里面设置断点,然后continue到那个断点,一般情况下多线程的时候,由于是同时运行的,最好设置 set scheduler-locking on

这样的话,只调试当前线程 

 --------------------------------------------------------------------------------------------------------------

二.实战片


调试程序:

[cpp] view plaincopy
  1. #include<stdio.h>  
  2. #include <stdlib.h>  
  3. #include <pthread.h>  
  4. #include <unistd.h>  
  5.   
  6. void * fun1 (void *arg1)  
  7. {  
  8.     printf ("[pthread1]  -- start\n");  
  9.     sleep (2);  
  10.     printf ("[pthread1]  -- end\n");  
  11.     pthread_exit ((void *) NULL);  
  12. }  
  13.   
  14. void * fun2 (void *arg1)  
  15. {  
  16.     printf ("[pthread2]  -- start\n");  
  17.     sleep (2);  
  18.     printf ("[pthread2]  -- end\n");  
  19.     pthread_exit ((void *) NULL);  
  20. }  
  21.   
  22. int main(void)  
  23. {  
  24.   
  25.     pthread_t pid1, pid2;  
  26.     void *tmp;  
  27.   
  28.     printf ("[main] -- start\n");  
  29.   
  30.     if (pthread_create (&pid1, NULL, fun1, NULL)) {  
  31.         perror ("create pthread1 error\n");  
  32.         exit (1);  
  33.     }  
  34.     if (pthread_create (&pid2, NULL, fun2, NULL)) {  
  35.         perror ("create pthread2 error\n");  
  36.         exit (1);  
  37.     }  
  38.   
  39.     if (pthread_join (pid1, &tmp)) {  
  40.         perror ("join pthread1 error\n");  
  41.         exit (1);  
  42.     }  
  43.   
  44.     if (pthread_join (pid2, &tmp)) {  
  45.         perror ("join pthread2 error\n");  
  46.         exit (1);  
  47.     }  
  48.   
  49.     sleep (2);  
  50.     printf ("[main] -- end\n");  
  51.     return 0;  
  52. }  

本程序有3个线程, main 线程先执行,然后创建2个子线程。创建后main 线程等子线程结束,最后再退出。

多线程程序的顺序是未知的,但我们用gdb 调试,可以指定每个线程的前后顺序。以这个例子为例: main 线程创建完 pthread2 和 pthread3 后,不知道

 pthread2 先执行,还是 pthread3 先执行,也不知道是pthread2 先结束还是pthread3 先结束。  但我们这次调试,等main 线程创建完pthread2 后,先指定

pthread2 先执行,先调试它,等pthread2结束了,再调试pthread3,最后返回调试main线程


[plain] view plaincopy
  1. (gdb) b 28                     # 先在main 线程设置断点,设置到创建 pthread2 线程处  
  2. Breakpoint 1 at 0x4007dc: file d.c, line 28.  
  3.   
  4. 30        if (pthread_create (&pid1, NULL, fun1, NULL)) {  

[plain] view plaincopy
  1. (gdb) set scheduler-locking on     # 在创建pthread2 后,线程的执行顺序就不定了,所以我们先设置 scheduler ,指定<单一线程调试>模式  



[plain] view plaincopy
  1. (gdb) n                         # 在这步,pthread2线程已经创建,main线程停在创建pthread3线程处。由于我们是单线程调试,所以pthread2虽然创建了,但没执行  
  2. [New Thread 0x7ffff7fe5700 (LWP 25412)]  
  3. 34        if (pthread_create (&pid2, NULL, fun2, NULL)) {  



[plain] view plaincopy
  1. (gdb) info thread                 # 察看线程信息,  现在main 创建了pthread2 线程,所以有两个线程, 我们目前在调试1线程(就是main线程, 星号代表当前线程)  
  2.   Id   Target Id         Frame  
  3.   2    Thread 0x7ffff7fe5700 (LWP 25412) "a.out" 0x0000003bd880dd9c in __lll_lock_wait_private () from /lib64/libpthread.so.0  
  4. * 1    Thread 0x7ffff7fe6740 (LWP 25409) "a.out" main () at d.c:34  


[plain] view plaincopy
  1. (gdb) thread 2                    #  现在我们让main线程就停在这,去调试 pthread2线程  
  2. [Switching to thread 2 (Thread 0x7ffff7fe5700 (LWP 25412))]  



[plain] view plaincopy
  1. (gdb) b 8                       # pthread2 线程是执行一个函数,所以在函数处加入断点  
  2. Breakpoint 2 at 0x400778: file d.c, line 8.  



[plain] view plaincopy
  1. (gdb) c                     # pthread2 调试到我们的断点处  
  2.   
  3. Continuing.  



一直n ,把pthread2 调试完毕


[plain] view plaincopy
  1. (gdb) n           <span style="color:#3333FF;"><strong> </strong></span># pthread2 执行完毕  
  2. 0x0000003bd8807cd7 in start_thread () from /lib64/libpthread.so.0  
  3. Missing separate debuginfos, use: debuginfo-install libgcc-4.7.0-4.fc17.x86_6  


[plain] view plaincopy
  1. (gdb) thread 1         #这时我们跳回 main 线程,去创建 pthread3  
  2. [Switching to thread 1 (Thread 0x7ffff7fe6740 (LWP 25409))]  


[plain] view plaincopy
  1. (gdb) n  
  2. [New Thread 0x7ffff77e4700 (LWP 25424)]  
  3. 39        if (pthread_join (pid1, &tmp)) {  
  4. (gdb) thread 3  
  5. [Switching to thread 3 (Thread 0x7ffff77e4700 (LWP 25424))]  


同上,把pthraed3调试完毕,再跳回 main 线程


[plain] view plaincopy
  1. (gdb) thread 1  
  2. [Switching to thread 1 (Thread 0x7ffff7fe6740 (LWP 25409))]  
  3. #0  main () at d.c:39  
  4. 39        if (pthread_join (pid1, &tmp)) {  


这时main线程停止在 pthread_join 处,如果继续调试,main线程会阻塞(不确定为什么),这时我们设置  set scheduler-locking off 关闭单线程调试,然后继续调试

main 线程就不会阻塞。

GDB调试多进程的方法可以参考GDB调试NGINX的文章 可以跟踪一个进程进行调试