首页 > 代码库 > 迭代器和生成器函数

迭代器和生成器函数

引入:

l = [1,2,3,4,5]
s = {1,2,3,4}
for i in l:
    print(i)

如果代码是:

for i in 50:
    print(i)

这个运行不了。输出结果是 ‘int‘ object is not iterable

iterable是可迭代的意思。

哪些可以迭代呢?这些可以str、list、tuple、set、dic等

可迭代的标志是  _iter_。

那我们如何判断是否可以迭代呢?

print(__iter__ in dir([1,2,3]))

双下划线的内置方法一般不用这种方法调用:

print(next(l.__iter__()))

而是用这种方法调用:

print(next(iter(l)) )

小结:

(1)可迭代协议——凡是可迭代的内部都有一个__iter__方法

(2)迭代器里既有iter方法,又有next方法 ——迭代器协议

(3)通过iter(o)得到的结果就是一个迭代器

(4)0是可迭代的对象

判断是否是迭代器和可迭代对象的方法:

from collections import Iterable
from collections import Iterator
s = abc
print(isinstance(s,Iterable))
print(isinstance(s,Iterator))
print(isinstance(iter(s),Iterator))

生成器包括两个方面:生成器函数和生成器表达式

生成器有两种:一种是调用方法直接返回的,一种是可迭代对象通过执行iter方法得到的,迭代器有的好处是可以节省内存。

如果在某些情况下,我们也需要节省内存,就只能自己写。我们自己写的这个能实现迭代器功能的东西就叫生成器。

python中内置的生产器:

(1)生成器函数:关键字是yield,yield语句一次返回一个结果,在每个结果中间,挂起函数的状态,以便下次继续运行。

(2)生成器表达式:类似于列表推导式,但是返回的是一个对象而不是一个结果列表 ,即惰性运算。

生成器函数:一个含有yield的函数就是生产器函数。通过调用返回的是一个对象,而不是结果列表。通过每一次对这个对象的请求就得到一个值def func():    print(aaaa)

    a=1
    yield a#返回第一个值
    print(bbbbb)
    yield 12#返回第二个值
    print(cccccc)
    yield 56#返回第三个值
ret=func()#拿到一个生成器
print(next(ret))#取第一个值
print(next(ret))#ret不可以用func替代
print(next(ret))

生成器例子:可以监听一个文本输入的文本

import time
def tail(filename):
    with open(filename) as f:
        f.seek(0,2)
        while True:
            line=f.readline()
            if not line:
                #time.sleep()
                continue
            yield line
for line in tail(监视文件):
    print(line,end=‘‘)

可以计算移动平均值的例子:

def averager():
    total=0
    day=0
    average=0
    while True:
        day_num=yield average
        total+=day_num
        day+=1
        average=total/day
avg=averager()#直接返回生成器
next(avg)#激活生成器avg.sed(),什么都 不send和next效果一样
print(avg.send(10))
print(avg.send(15))
print(avg.send(80))

装饰器版计算移动平均值的例子:

def wrapper(func):
    def inner(*arge,**kwargs):
        ret=func(*arge,**kwargs)
        next(ret)
        return ret
    return inner
@wrapper
def averager():
    total=0
    day=0
    average=0
    while True:
        day_num=yield average
        total+=day_num
        day+=1
        average=total/day
avg=averager()#直接返回生成器
# next(avg)#激活生成器avg.sed(),什么都 不send和next效果一样
print(avg.send(10))
print(avg.send(15))
print(avg.send(80))

 

列表推导式和生成器表达式:

列表推导式:(两个代码实现相同的效果)

for i in range(100):
    print(i*i)
l=[i*i for i in range(100)]
print(l)
l = [{name:v,age:28},{name:v}]
name_list = [dic[name] for dic in l]
print(name_list)

 

生成器表达式:

l=(i*i for i in range(100))
print(next(l))
print(next(l))
print(next(l))
print(next(l))
l = [{name:v1,age:28},{name:v2}]
name_list_generator = (dic[name] for dic in l)
#print(name_list_generator)
print(next(name_list_generator))
print(next(name_list_generator))

 

我们会发现列表推导式和生成器表达式除了括号不一样外都一样。列表推导式是中括号,生成器表达式是小括号。

区别:列表推导式是把所有的数据都一起算出来,而生成器表达式是一种惰性运算你请求一次给你一个数据。因此相比较来说生成器表达式更节省内存。

Python不但使用迭代器协议,让for循环变得更加通用。大部分内置函数,也是使用迭代器协议访问对象的。例如, sum函数是Python的内置函数,该函数使用迭代器协议访问对象,而生成器实现了迭代器协议,所以,我们可以直接这样计算一系列值的和:

print(sum(x**2 for x in range(3)))

而不用多此一举先构造一个列表啦

print(sum([x**2 for x in range(3)]))

总结:

可迭代对象:

 拥有_inter_方法

 惰性计算

像str、list、tuple、set、dic等

迭代器:

拥有_inter_方法和next方法

像:iter(range()),iter(str),iter(list),iter(tuple),iter(dict),iter(set),reversed(list_o),map(func,list_o),filter(func,list_o),file_o

特点: 可以用for循环、 可以节省内存、只能用一次

生成器:本质是迭代器(同时拥有_inter_和next方法)

是开发人员自己定义的迭代器

优点:

1.延迟计算,你请求一次他给你返回一个结果。他不会给你返回所有的结果,不会大量占据内存

2.代码简洁,容易读

 

迭代器和生成器函数