首页 > 代码库 > 僵尸进程

僵尸进程

产生

  一个进程在调用exit命令结束自己的生命的时候,其实它并没有真正的被销毁,而是留下一个称为僵尸进程(Zombie)的数据结构(系统调用exit,它的作用是使进程退出,但也仅仅限于将一个正常的进程变成一个僵尸进程,并不能将其完全销毁)。

  在每个进程退出的时候,内核释放该进程所有的资源,包括打开的文件,占用的内存等。但是仍然为其保留一定的信息(包括进程号the process ID,退出状态the termination status of the process,运行时间the amount of CPU time taken by the process等)。直到父进程通过wait / waitpid来取时才释放. 但这样就导致了问题,如果进程不调用wait / waitpid的话,那么保留的那段信息就不会释放,其进程号就会一直被占用,但是系统所能使用的进程号是有限的,如果大量的产生僵死进程,将因为没有可用的进程号而导致系统不能产生新的进程. 此即为僵尸进程的危害,应当避免。

  在Linux进程的状态中,僵尸进程是非常特殊的一种,它已经放弃了几乎所有内存空间,没有任何可执行代码,也不能被调度,仅仅在进程列表中保留一个位置,记载该进程的退出状态等信息供其他进程收集,除此之外,僵尸进程不再占有任何内存空间。它需要它的父进程来为它收尸(wait与waitpid会释放这些信息资源http://www.2cto.com/os/201107/98258.html),如果他的父进程没安装SIGCHLD信号处理函数调用wait或waitpid()等待子进程结束,又没有显式忽略该信号,那么它就一直保持僵尸状态,如果这时父进程结束了,那么init进程自动会接手这个子进程,为它收尸,它还是能被清除的。但是如果父进程是一个循环,不会结束,那么子进程就会一直保持僵尸状态,这就是为什么系统中有时会有很多的僵尸进程。

查看

查看僵尸进程,利用命令ps,可以看到有标记为Z的进程就是僵尸进程

僵尸进程的避免

⒈父进程通过wait和waitpid等函数等待子进程结束,这会导致父进程挂起。
⒉ 如果父进程很忙,那么可以用signal函数为SIGCHLD安装handler,因为子进程结束后, 父进程会收到该信号,可以在handler中调用wait回收。
⒊ 如果父进程不关心子进程什么时候结束,那么可以用signal(SIGCHLD,SIG_IGN) 通知内核,自己对子进程的结束不感兴趣,那么子进程结束后,内核会回收, 并不再给父进程发送信号。
⒋ 还有一些技巧,就是fork两次,父进程fork一个子进程,然后继续工作,子进程fork一 个孙进程后退出,那么孙进程被init接管,孙进程结束后,init会回收。不过子进程的回收 还要自己做。
#第二种简单实现
import
os,time,signal def chldhandler(signum,stackframe): while 1: try: result=os.waitpid(-1,os.WNOHANG)#使用wait和waitpid来收集终止进程信息的行为被称为收割 except: break print "Reaped child process %d"%result[0] signal.signal(signal.SIGCHLD,chldhandler) signal.signal(signal.SIGCHLD,chldhandler) print "Before the fork my PID is %d "%os.getpid() pid=os.fork() if pid: print "Hello from the parent.The child will be PID %d"%pid print "Sleeping 10 seconds..." time.sleep(10) print "Sleep done." else: print "Child sleeping 5 seconds..." time.sleep(5)

 

import socket,traceback,os,sys def reap():     while 1:         try:             result=os.waitpid(-1,os.WNOHANG)             if not result[0]:break         except:             break         print "Rraped child porcess %d"%result[0] host =‘‘ port =51423  s=socket.socket(socket.AF_INET,socket.SOCK_STREAM) s.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1) s.bind((host,port)) s.listen(1) print "Parent at %d listening for conncetion"%os.getpid() while 1:     try:         clientsock,clientaddr=s.accept()     except KeyboardInterrupt:         raise     except:         traceback.print_exc()         continue    #收割     reap()     pid = os.fork()     if pid:         #好习惯         clientsock.close()         continue     else:         #好习惯         s.close()     try:         print "Child from %s being handled by PID %d"%                 (clientsock.getpeername(),os.getpid())         while 1:             data=clientsock.recv(4096)             if not len(data):                 break             clientsock.sendall(data)     except(KeyboardInterrupt,SystemExit):         raise     except:         traceback.print_exc()      try:         clientsock.close()    except KeyboardInterrupt:         raise     except:         traceback.print_exc()      sys.exit(0)

 

僵尸进程