1.生成器
如果创建一个有很多元素的列表,但是只需要访问前几个元素,后面的元素占着的空间就白白浪费了
在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。
在Python中,这种一边循环一边计算的机制,称为生成器:generator。
要创建一个generator,有很多种方法
第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:
L = [x * x for x in range(10)]
g = (x * x for x in range(10))
print(L)#
print(g)
输出
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
可以直接打印出list的每一个元素,但怎么打印出generator的每一个元素
print(next(g))
print(next(g))
输出
0
1
如果要一个一个打印出来,可以通过next()函数获得generator的下一个返回值:
generator保存的是算法,比如我要知道计算第四次的值,next要调用四次,这太麻烦了
for n in g:
print(n)
输出
0
1
4
9
16
25
36
49
64
81
如果要计算很多次,不断调用next实在是太变态了,正确的方法是使用for循环,generator也是可迭代对象,如果某些算法用列表生成式的for循环无法实现,还可以用函数,比如著名的斐波拉契数列(Fibonacci)
def fib(max):
n,a ,b = 0,0,1#n是用来控制迭代的次数
while n < max:
yield b
a,b = b,a+b
n = n+1
return 'done'
如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator:
函数是顺序执行,遇到return语句或者最后一行函数语句就返回
在调用生成器运行的过程中,每次遇到 yield 时函数会暂停并保存当前所有的运行信息,返回 yield 的值, 并在下一次执行 next() 方法时从当前位置继续运行
def add():
print('step 1')
yield 1
print('step 2')
yield (3)
print('step 3')
yield (5)
在调用该generator时,首先要生成一个generator对象,然后用next()函数不断获得下一个返回值:
o = add()
print(next(o))
print(next(o))
print(next(o))
输出
step 1
1
step 2
3
step 3
5
通过next调用时,遇到yield就停下了,再次调用在中断的地方继续往下执行
for n in add():
print(n)
输出
step 1
1
step 2
3
step 3
5
同样的,把函数改成generator后,基本上从来不会用next()来获取下一个返回值,而是直接使用for循环来迭代
要实验for需要把上面三次调用的代码删除,因为三次调用已经把函数全部执行完了,不会再去执行了。
但是用for循环调用generator时,发现拿不到generator的return语句的返回值
如果想要拿到返回值,必须捕获StopIteration错误,返回值包含在StopIteration的value中:
g = fib(6)
while True:
try:
x = next(g)
print('g:',x)
except StopIteration as e:
print('Generator return value:',e.value)
break
generator的工作原理,它是在for循环的过程中不断计算出下一个元素,并在适当的条件结束for循环。对于函数改成的generator来说,遇到return语句或者执行到函数体最后一行语句,就是结束generator的指令,for循环随之结束
注意区分普通函数和generator函数,普通函数调用直接返回结果
generator函数的“调用”实际返回一个generator对象
2.迭代器
凡是可作用于for循环的对象都是Iterable类型;比如list,tuple,dict,set,str,generator等
判断是否为Iterable类型
from collections import Iterable
print(isinstance([], Iterable))
输出
True
凡是可作用于next()函数的对象都是Iterator类型,它们表示一个惰性计算的序列;
直到最后抛出StopIteration错误表示无法继续返回下一个值了。
可以使用isinstance()判断一个对象是否是Iterator对象,生成器都是Iterator对象
from collections import Iterator
print(isinstance((x for x in range(10)), Iterator))
输出
True
集合数据类型如list、dict、str等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象。
'''
学习中遇到问题没人解答?小编创建了一个Python学习交流群:711312441
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
isinstance(iter([]), Iterator)
isinstance(iter('abc'), Iterator)
list=[1,2,3,4]
it = iter(list)
print(next(it))
print(next(it))
#迭代器也可以用常规for语句进行遍历
for x in it:
print('当前计算:',x)#上面调用了两次,所以这边会接着上一次继续下去,只会打印两句,如果上面只
#调用一次,这里会调用三次
输出
1
2
当前计算: 3
当前计算: 4
3.总结
凡是可作用于for循环的对象都是Iterable类型 可迭代对象
凡是可作用于next()函数的对象都是Iterator类型,它们表示一个惰性计算的序列
集合数据类型如list、dict、str等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象
Python的for循环本质上就是通过不断调用next()函数实现的
比较使用list和generator保存斐波拉契数列运算结果的的区别
通过返回 List 能满足复用性的要求,但是当max函数运行占用的内存会随着max的增大而增大
def fab(max):
n, a, b = 0, 0, 1
L = []
while n < max:
L.append(b)
a, b = b, a + b
n = n + 1
return L
for n in fab(5):
print(n)
输出
1
1
2
3
5
一个带有 yield 的函数就是一个 generator,它和普通函数不同,生成一个 generator 看起来像函数调用,但不会执行任何函数代码,直到对其调用 next()(在 for 循环中会自动调用 next())才开始执行。虽然执行流程仍按函数的流程执行,但每执行到一个 yield 语句就会中断,并返回一个迭代值,下次执行时从 yield 的下一个语句继续执行。看起来就好像一个函数在正常执行的过程中被 yield 中断了数次,每次中断都会通过 yield 返回当前的迭代值。
yield 的好处是显而易见的,把一个函数改写为一个 generator 就获得了迭代能力,比起用类的实例保存状态来计算下一个 next() 的值,不仅代码简洁,而且执行流程异常清晰。
def fab(max):
n, a, b = 0, 0, 1
while n < max:
yield b # 使用 yield
# print b
a, b = b, a + b
n = n + 1
for n in fab(5):
print(n)
输出
1
1
2
3
5