当我们需要简单迭代一个数量范围的时候,Python给了我们一个非常好用的函数:range。Lignos观察到有些初学者喜欢用range来迭代列表的下表,像下面这种形式:
for i in range(len(alist)): print alist[i]这代码现在还没什么问题,但已经不符合Python的习惯了。但下面的代码就有问题了:
alist = ['her', 'name', 'is', 'rio'] for i in range(0, len(alist) - 1): # 漏掉了最后一个 print i, alist[i]我们可以看一下Python官方文档range的示例:
>>> range(1, 11) [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]range的右区间是不包含在内的,如果受了直觉或其他编程语言的影响,再减1就不对了。Lignos还列举了其他几种错误的迭代模式,我们只要记住,range应该用在迭代一个数量范围。
Lignos给出了两段代码:
lyrics_list = ['her', 'name', 'is', 'rio'] words = make_wordlist() for word in words: if word in lyrics_list: # 线性时间 print word, "is in the lyrics"和
lyrics_set = set(lyrics_list) words = make_wordlist() for word in words: if word in lyrics_set: # 常数时间 print word, "is in the lyrics"哪种模式效率更高?Lignos注释已经给出了答案。注释的意思是,判断一个元素是否在一组元素中存在,使用list的算法复杂度是O(n),而使用set的算法复杂度是O(1)。那是否set永远是优于list?在其他情况下,应该用哪个数据结构?Python官方Wiki有一份专门各个数据结构操作的时间复杂度的文档供参考,知道参考这份文档比答案本身更重要。至于为什么,只有Python的源码才能告诉我们。
初学者往往会假设一些不该假设的前提,对一些异常流程考虑不周。Lignos也给了一个例子:
for idx, value in enumerate(y): if value > max_value: break processList(y, idx)这里y如果是空的,那就出问题了,因为idx根本得不到定义,最终我们会得到一个NameError的异常。比较好的做法是给idx一个默认的错误值,在C语言里面我们经常喜欢用-1。下面的代码就考虑得比较全面:
def find_item(item, alist): # 对Python来说None比-1可能更好点 result = -1 for idx, other_item in enumerate(alist): if other_item == item: result = idx break return result