首页 > 代码库 > python简单笔记

python简单笔记

迭代器

迭代是Python最强大的功能之一,是访问集合元素的一种方式。

迭代器是一个可以记住遍历的位置的对象。

迭代器对象从集合等第一个元素开始访问,直到所有的元素被访问结束,迭代器只能往前不会后退。

迭代器有两个基本的方法:iter()next()

字符串,列表或元组对象都可以用于创建迭代器。

迭代器的一大优点是不要求事先准备好整个迭代过程中所有的元素。迭代器仅仅在迭代到某个元素时才计算该元素,而在这之前或之后,元素可以不存在或者被销毁。这个特点使得它特别适合用于遍历一些巨大的或是无限的集合,比如几个G的文件

特点:

  1. 访问者不需要关心迭代器内部的结构,仅需通过next()方法不断去取下一个内容
  2. 不能随机访问集合中的某个值 ,只能从头到尾依次访问
  3. 访问到一半时不能往回退
  4. 便于循环比较大的数据集合,节省内存
>>> list = [1,2,3,4]
>>> it = iter(list)  # 创建迭代器对象
>>> print(next(it))  # 输出迭代器的下一个元素
1
>>> print(next(it))
2

迭代器对象可以使用常规for语句进行遍历:

list=[1,2,3,4]
it = iter(list)    # 创建迭代器对象
for x in it:
    print (x)

执行以上程序,输出结果如下:

1
2
3
4

也可以使用 next() 函数:

import sys         # 引入 sys 模块

list=[1,2,3,4]
it = iter(list)    # 创建迭代器对象

while True:
    try:
        print (next(it))
    except StopIteration:
        sys.exit()

执行以上程序,输出结果如下:

1
2
3
4

凡是能够用for循环遍历的数据结构和对象统统可以称为可迭代的,即Iterable。我们现在接触到Iterable数据结构有list、tuple、dict、string、set,还有生成器generator(下面将讲到)。

但是,他们之间有什么区别呢?generator不但可以使用for循环,还可以被next()函数不断调用并返回下一个值,直到返回StopIteration错误。

能够被next()函数不断调用并返回下一个值的对象称为迭代器Iterator。generator是Iterable,同时也是一个Iterator;而list、tuple、str、dict不是Iterator。

当然,可以通过isinstance()判断一个对象是否为Iterator。

>>> from collections import Iterator
>>> isinstance((x*x for x in range(10)), Iterator)
True
>>> isinstance([],Iterator)
False
>>> isinstance({},Iterator)
False
>>> isinstance("ABC",Iterator)
False

如果想让list、tuple、str、dict等Iterable对象转变成Iterator,用iter()函数能够让Iterable对象变为Iterator

>>> isinstance(iter("ABC"),Iterator)
True
>>> i = iter("ABC")
>>> next(i)
‘A‘
>>> next(i)
‘B‘
>>> next(i)
‘C‘

Iterable和Iterator对象到底有什么区别呢?

实际上,python中Iterator对象表示的是一个数据流,Iterator对象可以被next()函数不断调用返回下一个值,直到数据全部被返回。Iterator对象数据流可以被看作是一个序列,但是这个序列的长度是不可提前预知的,因为只能通过next()或者for循环按照需要调用下一个数据,所以Iterator对象的计算是一种惰性计算。

正是因为这样的特性,Iterator可以表示一个无限大的数据流,譬如全体自然数,而list是无法完成这样的任务的。

 

列表生成式

在讲到生成器之前我们先来讲一下列表生成式

列表生成式,顾名思义,就是用来生成列表的。以前我们生成列表的时候,一般都是先定义一个list = [] ,再用for循环将元素一个一个append到list中。

简单列表的生成,可以使用list(range(1,100)),那么如果需要生成[1*1,2*2,3*3....]呢?

>>> [x*x for x in range(10)]
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

同时,还可以添加一些更多的要素,判断使用符合要求的x参与计算。

>>> [x*x for x in range(10) if x%2==0]
[0, 4, 16, 36, 64]

使用多重循环还可以生成全排列

>>> [x+y for x in ‘ABC‘ for y in ‘LMN‘]
[‘AL‘, ‘AM‘, ‘AN‘, ‘BL‘, ‘BM‘, ‘BN‘, ‘CL‘, ‘CM‘, ‘CN‘]
>>>
>>> [x+y+z for x in ‘ABC‘ for y in ‘LMN‘ for z in ‘OPQ‘ if z==‘Q‘]
[‘ALQ‘, ‘AMQ‘, ‘ANQ‘, ‘BLQ‘, ‘BMQ‘, ‘BNQ‘, ‘CLQ‘, ‘CMQ‘, ‘CNQ‘]

生成器

通过列表生成器,我们可以创造一个列表。但是,受到内存容量的限制,列表的容量肯定是有限的,如若我们只需要使用列表中的一部分,就不需要一下子生成很大的列表,直接按需生成就好了,列表生成器就提供了这样的功能。

生成器相当于是一个生成列表元素的算法,有了这个算法,就不用一下子生成很多元素了,只需要在需要的时候生成就可以了,节省了很多空间。在Python中,这种一边循环一遍计算的机制,称为:generator。

创建一个generator只需要把列表生成器的[]改成()就可以了。

>>> [x*x for x in range(10)]
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
>>> (x*x for x in range(10))
<generator object <genexpr> at 0x00000259A50BD308>

获取generator里面的元素,可以使用next()函数生成generator的下一个元素。

>>> g=(x*x for x in range(10))
>>> next(g)
0
>>> next(g)
1
>>> next(g)
4
.
.
.
>>> next(g)
81
>>> next(g)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

一直调用next()函数就可以遍历generator的所有元素,直到抛出StopIteration错误。

但是最常用的当然还是for循环,毕竟generator也是Iterator的对象。

>>> g=(x*x for x in range(5))
>>> for element in g:
...     print(element)
...
0
1
4
9
16

一般我们创建一个generator后,基本上不会调用next(),而是通过for循环来迭代它,并且不需要关心StopIteration的错误。

有时候,推算元素的算法很复杂,并不能通过列表生成器实现,而需要通过函数打印出来,譬如菲波那切数列。

#!/usr/bin/env python

def fib(Max):
    n = 0
    a,b = 0,1
    while n < Max:
        print(b)
        a,b = b,a+b
        n = n + 1

fib(5)

结果:
1
1
2
3
5

在Python中,使用了yield的函数被称为生成器(generator)。

跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。

在调用生成器运行的过程中,每次遇到yield时函数会暂停并保存当前所有灯运行信息,返回yield的值。并在下一次执行next()方法时从当前位置继续运行。

#!/usr/bin/env python

def fib(Max):
    n = 0
    a,b = 0,1
    while n < Max:
        yield b
        a,b = b,a+b
        n = n + 1

g = fib(5)
print(next(g))
print(next(g))
for i in g:
    print(i)

结果:
1
1
2
3
5

在函数的执行过程中,遇到return才会返回,但是变成了generator的函数,遇到了yield就会中断,并且返回yield的参数。

那么,遇到了yield就会中断并返回,我们能不能通过yield传一些参数进去呢?

#!/usr/bin/env python

def fib(Max):
    n = 0
    a,b = 0,1
    while n < Max:
        e = yield b
        print(e)
        a,b = b,a+b
        n = n + 1

g = fib(5)
print(next(g))
print(next(g))
print(g.send("the third element"))
print(g.send("forth"))

结果:
1
None
1
the third element
2
forth
3

在上面的generator定义中,使用了e = yield b语句,这样遇到yield返回b的同时,还能够通过g.send(arg)传入一个参数赋值给e,这样,就可以通过generator进行参数传递了。

>>> def fib(Max):
...     n = 0
...     a,b = 0,1
...     while n < Max:
...         e = yield b
...         print(e)
...         a,b = b,a+b
...         n = n + 1
...
>>> g = fib(5)
>>> g.send("the first element")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: can‘t send non-None value to a just-started generator
>>> g.send(None)
1

注意,看上面的代码,为什么会报错?说明启动一个generator的时候,只能传入None作为参数,而generator就相当于next(g)!

 

2.装饰器

原则:
1、不能修改被装饰函数的源代码。
2、不能修改被装饰函数的调用方式。
3、不能改变被装饰函数的执行结果。
装饰器对被装饰函数是透明的。

如何理解装饰器
1、函数即“变量”
2、高阶函数
a:把一个函数名作为实参传递给另外一个函数
b:返回值中包含函数名
3、嵌套函数
在一个函数体内声明另一个函数称为函数的嵌套

 

参考链接:http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/0014318435599930270c0381a3b44db991cd6d858064ac0000

装饰器(decorator)是一种高级的Python语法。装饰器可以对一个函数,方法或者类加工。

由于函数也是一个对象,而且函数对象可以被赋值给变量,所以,通过变量也能调用该函数。

>>> def now():
...     print(‘2017-05-01‘)
...
>>> f = now
>>> f()
2017-05-01

函数对象有一个__name__属性,可以拿到函数的名字:

>>> now.__name__
‘now‘
>>> f.__name__
‘now‘

现在,假设我们要增强now()函数的功能。比如,在函数调用前后自动打印日志,但是又不希望修改now()函数的定义,这种在代码运行期间动态增加功能的方式,就称之为:装饰器(decorator)。

本质上,decorator就是一个返回函数的高阶函数。所以,我们要定义一个能打印日志的decorator,可以定义如下:

def log(func):
    def wrapper(*args, **kwargs):
        print("call %s():" % func.__name__)
        return func(*args, **kwargs)
    return wrapper

观察上面的log,因为它是一个decorator,所以接受一个函数作为参数,并返回一个函数。我们要借助Python的@语法,吧decorator置于函数的定义处:

@log  # 把这句放在这儿就相当于执行了 now = log(now)
def now():
    print("2017-05-01")

调用now()函数,不仅会运行now()函数本身,还会运行now()函数前打印一行日志:

>>> now()
call now():
2017-05-01

把@log放在now()函数的定义处,就相当于执行了语句:

now = log( now )

由于log()是一个decorator,返回一个函数,所以,原来的now()函数仍然存在,只是现在同名的now变量指向了新的函数,于是调用now()将执行新函数,即在log()函数中返回的wrapper()函数。

如果decorator本身需要传入参数,那就需要编写一个返回decorator的高阶函数,写出来会更复杂。比如,要自定义log的文本:

>>> def log(text):
...     def decorator(func):
...         def wrapper(*args, **kwargs):
...             print("%s %s():" % (text, func.__name__))
...             return func(*args, **kwargs)
...         return wrapper
...     return decorator
...
>>> @log("execute")
... def now():
...     print("2017-05-01")
...
>>> now()
execute now():
2017-05-01

和两层嵌套的decorator相比,3层嵌套的效果是这样的:

>>> now = log("execute")(now)

我们来剖析上面的语句,首先执行log(‘execute‘),返回的是的decorator函数,在调用返回的函数,参数是now函数,返回值最终是wrapper函数。

以上两种decorator的定义都没有问题,但还差最后一步。因为我们讲了函数也是对象。它有__name__等属性,但你去看经过decorator装饰之后的函数,它们的__name__已经从原来的‘now‘变成了‘wrapper‘:

>>> now.__name__
‘wrapper‘

因为返回的那个wrapper()函数名字就是‘wrapper‘,所以,需要把原始函数的__name__等属性复制到wrapper()函数中,否则,有些依赖函数签名的代码执行就会出错。

不需要编写wrapper.__name__ = func.__name__这样的代码,Python内置的functools.wraps就是干这个事的,所以,一个完整的decorator的写法如下:

import functools

def log(func):
    @functools.wraps(func)
    def wrapper(*args, **kw):
        print(‘call %s():‘ % func.__name__)
        return func(*args, **kw)
    return wrapper

@log("execute")
def now():
    print("2017-05-01")

now()

或者针对带参数的decorator:

import functools

def log(text):
    def decorator(func):
        @functools.wraps(func)
        def wrapper(*args, **kwargs):
            print("%s %s():" % (text, func.__name__))
            return func(*args, **kwargs)
        return wrapper
    return decorator

@log("execute")
def now():
    print("2017-05-01")

now()

python简单笔记