首页 > 代码库 > yield表达式形式
yield表达式形式
首先了解
1.iterator
iterator叫做迭代器,用来遍历可以序列化的数据,比如一个list,set 等,当然如果对象想要能够使用迭代器来遍历,只要在该对象的类中添加__iter__()方法,该方法返回一个迭代器对象,迭代器对象中需要实现next()方法
for example:
>>> class sequenceClass(object): ... def __init__(self, *args): ... self._data = list(args) ... def __iter__(self): ... return DataIter(self) ... >>> class DataIter(object): ... def __init__(self, data): ... self._index = 0 ... self._data = data._data ... def next(self): ... if self._index >= len(self._data): raise StopIteration() ... d = self._data[self._index] ... self._index += 1 ... return d ... >>> data = sequenceClass(1,2,3,4) >>> for x in data: print x ... 1 2 3 4
执行方法如下:
创建对象data : data = http://www.mamicode.com/sequenceClass(1,2,3,4)
使用for循环遍历data:
1.第一次for循环遍历data时,调用了data的__iter__()方法,该方法返回一个迭代器对象:DataIter
2.接着for循环每次调用DataIter对象的next()方法,next()方法返回数据
3.等到数据遍历完成时,抛出异常StopIteration, 该异常被for循环扑获,遍历结束。
以上是iterator的实现方法,但有一种更加简单的方式,但初学时可能不太好理解,就是使用yield表达式来遍历对象。
2.yield表达式及genetator
Python中,凡是含有yield的函数,被调用时都返回一个generator对象。generator设计的目的是能够更加简单的实现迭代器协议,例如上面的例子,需要单独写一个类来遍历数据,而用generator,直接一个yield表达式就可以用做迭代器了
>>> def test_generator(): ... s = 0 ... for i in xrange(10): ... s = yield i * s ... print ‘i:‘, i ... print ‘s:‘, s ... print ‘i * s‘, i * s ... >>> t = test_generator() >>> t <generator object test_generator at 0x10403a820> >>> >>> t.next() 0 >>> t.send(10) i: 0 s: 10 i * s 0 10 >>> t.send(11) i: 1 s: 11 i * s 11 22
执行方法如下:
1.定义了一个函数叫做test_generator
2.调用test_generator,得到t对象
3.运行t时,是一个generator对象
4.t.next()或者t.send(None)启动generator对象, generator对象运行到yield,将yield右面的表达式的值返回,并保存generator对象当前的状,因此,后面的打印都没有被执行。
5.t.send(10)
1)将输入的值10赋值给s
2)执行yield后面的表达式,即将所有print执行完毕,解析如下:
由于在第4步generator保存了对象的当前的状态,因此: i = 0, s是刚输入的值为10, i *s 当然就为0了,接着进入下一次循环,此时i= 1,执行yield表达式,结果得10,保存当前generator状态,返回10,generator停止运行。
6.t.send(11)
1)和第5步类似了,将11输入给s
2)因为第5步,generator保存了当前的对象的值,因此: i = 1, s是刚输入的值为11, i *s 当然就为11了,接着进入下一次循环,此时i= 2,执行yield表达式,结果得22,保存当前generator状态,返回22,generator停止运行。
7.接下来在调用t.send(num),和第5,6步一样,直到generator内部的循环完成,当再次调用时,将抛出异常:StopIteration
总结一下:
1. yield表达式, 四种形式:
a. 不接受输入值或者输入值是None
yield 1
b. 接受输入值
s = yield 1
c. 接受输入,但不返回数据,这样默认返回None
s = yield
d.既不接受输入,也不返回值,默认返回None
yield
第一种:当函数调用到yield时,返回yield的右边经过计算的值 ,这里说计算的意思是,yield后面可以写成函数,表达式等,
第二种:当函数调用到yield时,必须传入一个值,该值存入s中,然后返回yield后面的表达式的值并保存当前状态
第三种:只是将数据接受进来,然后执行yield后的语句,再次执行到yield时,保存当前状态并返回,这样的用例一般是
只打印一些处理消息,而不需要结果的方式。
第四种:这样的只能遍历generator内部的数据了。
2.使用generator的好处:
1)可以很方便的实现迭代器,即yield不接受输入值
2)使用generator可以减少内存的使用,因为遍历出来的值都是每次进行计算的,不用一次性全部计算完成,然后一个个
遍历,最终释放掉;另外可以在yield后面做一些操作,可以很随意的控制返回值。
3.coroutine 协程
使用yield的函数,若用send来控制,就算coroutine了,若用for循环来控制,就算generator或者iterator,使用方法大多见于
decorator, 如tornado中的gen.coroutine。
实例:
#应用:grep -rl ‘root‘ /etc 模拟linux中的grep -rl 命令,来过滤含有root内容的文件,并打印文件名 # import os # def f1(func): #程序初始化 # def wrapper(*args, **kwargs): # g=func(*args, **kwargs) # next(g) # return g # return wrapper # #阶段一,递归的找文件的绝对路径,把路径发给阶段2 # @f1 # def search(target): # ‘search file abspath‘ # while True: # start_path = yield # g = os.walk(start_path) # for par_dir, _, files in g: # for file in files: # file_path = r‘%s\%s‘ % (par_dir, file) # target.send(file_path) # #阶段2,收到文件路径, 打开文件获取对象,吧文件对象发给阶段3 # @f1 # def opener(target): # ‘get file obj: f = open(file_path)‘ # while True: # file_path = yield # with open(file_path, ‘r‘, encoding=‘utf-8‘) as f: # target.send((file_path, f)) # #阶段三,收到文件对象,for循环读取文件的每一行内容,把每一行内容发给阶段4 # @f1 # def cat(target): # ‘read file‘ # while True: # file_path,f = yield # for line in f: # res = target.send((file_path, line)) # if res: # break # #阶段4,收到一行内容,判断root是否在这一行,如果在,则把文件名发给阶段五 # @f1 # def grep(target, pattern): # ‘grep functhion‘ # tag=False # while True: # file_path, line = yield tag # tag = False # if pattern in line: # target.send(file_path) # tag=True # #阶段五,收到文件名,打印结果 # @f1 # def printer(): # ‘print function‘ # while True: # filename = yield # print(filename) # start_path1 = r‘E:\Pycharmlx\June\day\day21root‘ # start_path2 = r‘E:\Pycharmlx\June\day\day21root\t‘ #绝对路径 # g = search(opener(cat(grep(printer(), ‘root‘)))) # # print(g) # g.send(start_path1) # g.send(start_path2)
yield表达式形式