首页 > 代码库 > Python 多线程 -thread threading Queue- 简单学习

Python 多线程 -thread threading Queue- 简单学习

 

Python 多线程 -thread threading Queue- 简单学习

在实际工作过程中,会出现需要并发的做一些事情,例如一台机器测到几千台机器的网络连通性,如果你单线程一台一台测的话,会花费很多的事情,不具有实时性,更不能在变化的时候立刻感知当时网络的状况,这时多线程就是一个很好地选择。python已经给我们封装好了多线程库thread和threading。

thread:比较底层的模块
threading:Higher-level threading interface

ps:建议使用threading模块
- 高级别的threading模块更为先进,对线程的支持更为完善
- 低级别的thread模块同步原语很少
- thread模块对线程什么时候结束完全没有控制,当主线程结束时,所有线程都会强制结束

thread

模块函数

start_new_thread(function, args,kwargs=None): 产生新的线程,args是function的参数,没有时写(),kwargs用来调用这个函数
allocate_lock(): 分配锁,LockType类型
exit(): 让线程退出

LockType的操作

acquire(wait=None):尝试获取锁
locked(): 获取了锁返回True,没有返回False
release():释放锁

Demo1

$ cat t1.pyimport threadfrom time import sleepdef a():    print "a start"    sleep(2)    print "a end"def b():    print "b start"    sleep(2)    print "b end"def main():    thread.start_new_thread(a,())    thread.start_new_thread(b,())    print "all done"if __name__ == "__main__":    main()$ python t1.pyall doneb starta start

最终会发现,每一次运行出来的结果都有可能不同,但是绝对不会出现“a end”和“b end”。这是为什么呢,这里没有写让主线程停下来等所有子线程结束后再继续运行的代码,所以main线程在执行完print "all done"就关闭了a和b两个线程。怎么办呢,可以在这里加一个sleep等待子进程执行完毕后再退出。

Demo2: thread -- 多线程的演示 by sleep

$ cat t2.pyimport threadfrom time import sleepdef a():    print "a start"    sleep(2)    print "a end"def b():    print "b start"    sleep(2)    print "b end"def main():    thread.start_new_thread(a,())    thread.start_new_thread(b,())    sleep (4)       ----防止主进程过早退出,加sleep等待子进程执行完毕后再推出    print "all done"if __name__ == "__main__":    main()$ python t1.py b starta starta endb endall done

但是假设我们不知道子进程执行的时间怎么办,这就是锁的用武之地了。因为使用锁要比使用sleep()函数更为合理。如下所示:

Demo3: thread -- 多线程演示 by lock

实现方式为: 主线程初始化两个锁,分别传给两个函数,两个函数在执行完自己的代码后释放锁,主线程一直在轮询这个锁有没有释放,如果释放了就退出。

def a(lock, nsec):    print "a starting at :", ctime()    sleep(nsec)    lock.release()    -- 执行完之后释放锁    print "a end", ctime()def b(lock, nsec):    print "b starting at :", ctime()    sleep(nsec)    lock.release()    -- 执行完之后释放锁    print "b end", ctime()def main():    print "Demo Starting at:", ctime()    locks = []    # Initialize lock  -- 主线程先获取两个锁,占为己有    for i in range(2):        lock = thread.allocate_lock()        lock.acquire()        locks.append(lock)    # 每个进程分配一个锁    thread.start_new_thread(a, (locks[0],2))    thread.start_new_thread(b, (locks[1],4))    for i in range(2):   #一直在轮询,看锁有没有释放        while locks[i].locked(): pass     print "all done at:", ctime()

最后的结果为:

$ python thread_demo.py Demo Starting at: Fri Aug 29 22:03:01 2014a starting at : Fri Aug 29 22:03:01 2014b starting at : Fri Aug 29 22:03:01 2014a end Fri Aug 29 22:03:03 2014b end Fri Aug 29 22:03:05 2014all done at: Fri Aug 29 22:03:05 2014

不难发现,thread库的同步机制比较难用,一切都需要主进程来处理。并且没有守护进程,主进程一退,整个世界都会变得很清静。而threading库给我们提供了守护进程。下面就来看看threading的简单用法。

threading

threading提供了Thread类,还提供了很多非常好用的同步机制。感觉重点了解Thread类就可以,多线程,也就是通过Thread类的多个实例。 类的主要方法有:

start():开始线程的执行。thread库里里面,是没有办法控制线程的开始的
join(timeout=None): 等待线程结束,有点类似Demo3中的轮询
run():定义线程的功能

感觉上面是比较重要的,立马就会用到的。还有一些其他的:

getName():获取线程名
setName(name):设置线程名
isAlive(): 返回bool 表示线程是否在运行中
activeCount():返回运行中的线程数
currentThread():返回当前线程对象
enumerate():返回当前活动线程的列表
isDaemon(): 返回线程的Daemon标志
setDaemon(daemonic): 设置线程的Daemon标志,一般在start()函数前调用
settrace(func):为所有线程设置跟踪函数
setprofile(func): 为所有线程设置profile函数

Demo4 -- threading演示

def loop(i, nsec):    print "thread %d starting at : %s" %(i, ctime())    sleep(nsec)    print "thread %d end at : %s" %(i, ctime())def main():    threads = []    loops = [2, 4]    # 实例化进程    for i in range(len(loops)):        t = threading.Thread(target = loop, args = (i, loops[i]))        threads.append(t)    for i in range(len(loops)):        threads[i].start()    for i in range(len(loops)):        threads[i].join()    print "all done"

最后的结果为:

thread 0 starting at : Sun Aug 31 13:31:28 2014thread 1 starting at : Sun Aug 31 13:31:28 2014thread 0 end at : Sun Aug 31 13:31:30 2014thread 1 end at : Sun Aug 31 13:31:32 2014all done

可见threading可以方便的控制线程的开始,以及等待每个线程的结束,并且也不用设置锁,释放锁,这些都被threading库封装了,相比于thread要更高级一些。在实际的运维工程中,可能会需要多个线程执行相同的任务,这时需要一个任务池。每个线程取任务池中取任务,执行,再取任务,再执行,一直到任务池为空,退出线程。这里就会用到下面要介绍的Queue库。

Queue

Queue模块可以用来实现多线程间通讯,让各个线程共享数据,生产者把货物放到Queue中,供消费者(线程)去使用。在python3中,Queue模块被命名为queue。 Queue的对象有:

Queue.Queue(maxsize=0): 创建大小为maxsize的FIFO(First In First Out)-Queue对象,如果maxsize不设置,这个队列将是无限的。
Queue.LifoQueue(maxsize=0): 创建先入后出的对象,即栈, 在python2.6中加入Queue.PriorityQueue(maxsize=0):有优先级的队列,在python2.6中加入

Queue对象的方法有:

qsize():返回队列的大小
empty():返回队列时候为空
full():返回队列是否满
put(item,block=0):向Queue对象中放数据,block不为0时,会一直等到队列中有控件为止
get(block=0):,同上,block不为0时,会一直等到队列中有数据为止

Demo5 -- Queue的使用演示
场景:Queue里面放着一些整数,需要将整数取出,并且睡眠整数大小的时间,下面的demo中,是放了10个1,如果单线程的话需要10s

def work(q):    while True:        if q.empty():            return        else:            t = q.get()            time.sleep(t)def main():    q = Queue.Queue()   # 初始化一个Queue对象    for i in range(10): # 向Queue生产任务        q.put(1)    work(q)if __name__ == "__main__":    main() 

最后的结果为:

time python threading_demo2.py real    0m10.085suser    0m0.060ssys 0m0.004s

单线程的话需要花费10s。

下面来通过多线程来处理Queue里面的任务:

def work(q):    while True:        if q.empty():            return        else:            t = q.get()            time.sleep(t)def main():    q = Queue.Queue()    for i in range(10):        q.put(1)    thread_num = 10    threads = []    for i in range(thread_num):        t = threading.Thread(target = work, args = (q,)) # args需要输出的是一个元组,如果只有一个参数,后面加,表示元组,否则会报错        threads.append(t)    for i in range(thread_num):        threads[i].start()    for i in range(thread_num):        threads[i].join()

看看这下的结果为:

real    0m1.046suser    0m0.024ssys     0m0.020s

因此对python多线程,主要学会使用threading和Queue,应该就可以足以应付运维中的一些问题。

 

<style></style>

Python 多线程 -thread threading Queue- 简单学习