Appearance
第3章 递归
本章内容:
- 学习递归。递归是很多算法都使用的一种编程方法,是理解本书后续内容的关键。
- 学习如何将问题分成基线条件和递归条件。第4章将介绍的分而治之策略使用这种简单的概念来解决棘手的问题。
我怀着激动的心情编写本章,因为它介绍的是递归——一种优雅的问题解决方法。递归是我最喜欢的主题之一,它将人分成三个截然不同的阵营:恨它的、爱它的以及恨了几年后又爱上它的。我本人属于第三个阵营。为帮助你理解,现有以下建议:
- 本章包含很多示例代码,请运行它们,以便搞清楚其中的工作原理。
- 请用纸和笔逐步执行至少一个递归函数,就像这样:我使用5来调用factorial,这将使用4调用factorial,并将返回结果乘以5,以此类推。这样逐步执行递归函数可搞明白递归函数的工作原理。
本章还包含大量伪代码。 伪代码是对手头问题的简要描述,看着像代码,但其实更接近自然语言。
3.1 递归 🚀
假设你在祖母的阁楼中翻箱倒柜,发现了一个上锁的神秘手提箱。
祖母告诉你,钥匙很可能在下面这个盒子里。
这个盒子里有盒子,而盒子里的盒子又有盒子。钥匙就在某个盒子中。为找到钥匙,你将使用什么算法?先想想这个问题,再接着往下看。
下面是一种方法。
(1) 创建一个要查找的盒子堆。
(2) 从盒子堆取出一个盒子,在里面找。
(3) 如果找到的是盒子,就将其加入盒子堆中,以便以后再查找。
(4) 如果找到钥匙,则大功告成!
(5) 回到第二步。
下面是另一种方法。
(1) 检查盒子中的每样东西。
(2) 如果是盒子,就回到第一步。
(3) 如果是钥匙,就大功告成!
在你看来,哪种方法更容易呢?第一种方法使用的是while循环:只要盒子堆不空,就从中取一个盒子,并在其中仔细查找。
python
def look_for_key(main_box):
pile = main_box.make_a_pile_to_look_through()
while pile is not empty:
box = pile.grab_a_box()
for item in box:
if item.is_a_box():
pile.append(item)
elif item.is_a_key():
print "found the key!"
第二种方法使用递归——函数调用自己,这种方法的伪代码如下。
python
def look_for_key(box):
for item in box:
if item.is_a_box():
look_for_key(item)
elif item.is_a_key():
print "found the key!"
这两种方法的作用相同,但在我看来,第二种方法更清晰。
递归只是让解决方案更清晰,并没有性能上的优势。实际上,在有些情况下,使用循环的性能更好。
我很喜欢Leigh Caldwell在Stack Overflow上说的一句话:“如果使用循环,程序的性能可能更高;如果使用递归,程序可能更容易理解。如何选择要看什么对你来说更重要。”
很多算法都使用了递归,因此理解这种概念很重要。
3.2 基线条件和递归条件 🚀
由于递归函数调用自己,因此编写这样的函数时很容易出错,进而导致无限循环。
例如,假设你要编写一个像下面这样倒计时的函数。
> 3...2...1
为此,你可以用递归的方式编写,如下所示。
python
import time
def countdown(i):
print(i)
time.sleep(1)
countdown(i - 1)
countdown(10)
如果你运行上述代码,将发现一个问题:这个函数运行起来没完没了!
> 3...2...1...0...-1...-2...
(要让脚本停止运行,可按Ctrl+C)
编写递归函数时,必须告诉它何时停止递归。正因为如此, 每个递归函数都有两部分:基线条件( base case)和递归条件( recursive case)。
递归条件指的是函数调用自己,而基线条件则指的是函数不再调用自己,从而避免形成无限循环。
我们来给函数countdown添加基线条件。
python
import time
def countdown(i):
print(i)
time.sleep(1)
if i <= 0:
return
else:
countdown(i - 1)
countdown(10)
现在,这个函数将像预期的那样运行,输出:
10
9
...
2
1
0
3.3 栈 🚀
本节将介绍一个重要的编程概念——调用栈( call stack) 。调用栈不仅对编程来说很重要,使用递归时也必须理解这个概念。
假设你去野外烧烤,并为此创建了一个待办事项清单——一叠便条。
本书之前讨论数组和链表时,也有一个待办事项清单。你可将待办事项添加到该清单的任何地方,还可删除任何一个待办事项。
一叠便条要简单得多:插入的待办事项放在清单的最前面;读取待办事项时,你只读取最上面的那个,并将其删除。
因此这个待办事项清单只有两种操作: 压入(插入)和弹出(删除并读取)。
这种数据结构称为栈。栈是一种简单的数据结构,刚才我们一直在使用它,却没有意识到!
3.3.1 调用栈 🚀
计算机在内部使用被称为调用栈的栈。我们来看看计算机是如何使用调用栈的。下面是一个简单的函数。
python
def greet(name):
print "hello, " + name + "!"
greet2(name)
print "getting ready to say bye..."
bye()
这个函数问候用户,再调用另外两个函数。这两个函数的代码如下。
python
def greet2(name):
print "how are you, " + name + "?"
def bye():
print "ok bye!"
下面详细介绍调用函数时发生的情况。
说 明 |
---|
在Python中, print是一个函数,但出于简化考虑,这里假设它不是函数。你也这样假设就行了。 |
假设你调用greet("maggie"),计算机将首先为该函数调用分配一块内存。
我们来使用这些内存。变量name被设置为maggie,这需要存储到内存中。
每当你调用函数时,计算机都像这样将函数调用涉及的所有变量的值存储到内存中。接下来,你打印hello, maggie!,再调用greet2("maggie")。同样,计算机也为这个函数调用分配一块内存。
计算机使用一个栈来表示这些内存块,其中第二个内存块位于第一个内存块上面。你打印how are you, maggie?,然后从函数调用返回。此时,栈顶的内存块被弹出。
现在, 栈顶的内存块是函数greet的,这意味着你返回到了函数greet。当你调用函数greet2时,函数greet只执行了一部分。这是本节的一个重要概念: 调用另一个函数时,当前函数暂停并处于未完成状态。该函数的所有变量的值都还在内存中。执行完函数greet2后,你回到函数greet,并从离开的地方开始接着往下执行:首先打印getting ready to say bye…,再调用函数bye。
在栈顶添加了函数bye的内存块。然后,你打印ok bye!,并从这个函数返回。
现在你又回到了函数greet。由于没有别的事情要做,你就从函数greet返回。这个栈用于存储多个函数的变量,被称为调用栈。
练习
3.1 根据下面的调用栈,你可获得哪些信息?
下面来看看递归函数的调用栈。
3.3.2 递归调用栈 🚀
递归函数也使用调用栈!来看看递归函数factorial的调用栈。 factorial(5)写作5!,其定义如下: 5! = 5 * 4 * 3 * 2 * 1。同理, factorial(3)为3 * 2 * 1。下面是计算阶乘的递归函数。
python
def fact(x):
if x == 1:
return 1
else:
return x * fact(x-1)
下面来详细分析调用fact(3)时调用栈是如何变化的。别忘了,栈顶的方框指出了当前执行到了什么地方。
注意,每个fact调用都有自己的x变量。在一个函数调用中不能访问另一个的x变量。栈在递归中扮演着重要角色。在本章开头的示例中,有两种寻找钥匙的方法。下面再次列出了第一种方法。
使用这种方法时,你创建一个待查找的盒子堆,因此你始终知道还有哪些盒子需要查找。
但使用递归方法时,没有盒子堆。
既然没有盒子堆,那算法怎么知道还有哪些盒子需要查找呢?下面是一个例子。
此时,调用栈类似于下面这样。
原来“盒子堆”存储在了栈中!这个栈包含未完成的函数调用,每个函数调用都包含还未检查完的盒子。使用栈很方便,因为你无需自己跟踪盒子堆——栈替你这样做了。
使用栈虽然很方便,但是也要付出代价:存储详尽的信息可能占用大量的内存。每个函数调用都要占用一定的内存,如果栈很高,就意味着计算机存储了大量函数调用的信息。在这种情况下,你有两种选择:
- 重新编写代码,转而使用循环。
- 使用尾递归。这是一个高级递归主题,不在本书的讨论范围内。另外,并非所有的语言都支持尾递归。
练习
3.2 假设你编写了一个递归函数,但不小心导致它没完没了地运行。正如你看到的,对于每次函数调用,计算机都将为其在栈中分配内存。递归函数没完没了地运行时,将给栈带来什么影响?
3.4 小结 🚀
- 递归指的是调用自己的函数。
- 每个递归函数都有两个条件:基线条件和递归条件。
- 栈有两种操作:压入和弹出。
- 所有函数调用都进入调用栈。
- 调用栈可能很长,这将占用大量的内存。