第3章递归

本章内容：

学习递归。递归是很多算法都使用的一种编程方法，是理解本书后续内容的关键。
学习如何将问题分成基线条件和递归条件。第4章将介绍的分而治之策略使用这种简单的概念来解决棘手的问题。

我怀着激动的心情编写本章，因为它介绍的是递归——一种优雅的问题解决方法。递归是我最喜欢的主题之一，它将人分成三个截然不同的阵营：恨它的、爱它的以及恨了几年后又爱上它的。我本人属于第三个阵营。为帮助你理解，现有以下建议：

本章包含很多示例代码，请运行它们，以便搞清楚其中的工作原理。
请用纸和笔逐步执行至少一个递归函数，就像这样：我使用5来调用factorial，这将使用4调用factorial，并将返回结果乘以5，以此类推。这样逐步执行递归函数可搞明白递归函数的工作原理。

本章还包含大量伪代码。伪代码是对手头问题的简要描述，看着像代码，但其实更接近自然语言。

3.1 递归 🚀

假设你在祖母的阁楼中翻箱倒柜，发现了一个上锁的神秘手提箱。

祖母告诉你，钥匙很可能在下面这个盒子里。

这个盒子里有盒子，而盒子里的盒子又有盒子。钥匙就在某个盒子中。为找到钥匙，你将使用什么算法？先想想这个问题，再接着往下看。

下面是一种方法。

(1) 创建一个要查找的盒子堆。

(2) 从盒子堆取出一个盒子，在里面找。

(3) 如果找到的是盒子，就将其加入盒子堆中，以便以后再查找。

(4) 如果找到钥匙，则大功告成！

(5) 回到第二步。

下面是另一种方法。

(1) 检查盒子中的每样东西。

(2) 如果是盒子，就回到第一步。

(3) 如果是钥匙，就大功告成！

在你看来，哪种方法更容易呢？第一种方法使用的是while循环：只要盒子堆不空，就从中取一个盒子，并在其中仔细查找。

python

def look_for_key(main_box):
    pile = main_box.make_a_pile_to_look_through()
    while pile is not empty:
        box = pile.grab_a_box()
        for item in box:
        	if item.is_a_box():
            	pile.append(item)
            elif item.is_a_key():
            	print "found the key!"

第二种方法使用递归——函数调用自己，这种方法的伪代码如下。

python

def look_for_key(box):
    for item in box:
        if item.is_a_box():
        	look_for_key(item)
        elif item.is_a_key():
        	print "found the key!"

这两种方法的作用相同，但在我看来，第二种方法更清晰。

递归只是让解决方案更清晰，并没有性能上的优势。实际上，在有些情况下，使用循环的性能更好。

我很喜欢Leigh Caldwell在Stack Overflow上说的一句话：“如果使用循环，程序的性能可能更高；如果使用递归，程序可能更容易理解。如何选择要看什么对你来说更重要。”

很多算法都使用了递归，因此理解这种概念很重要。

3.2 基线条件和递归条件 🚀

由于递归函数调用自己，因此编写这样的函数时很容易出错，进而导致无限循环。

例如，假设你要编写一个像下面这样倒计时的函数。

> 3...2...1

为此，你可以用递归的方式编写，如下所示。

python

import time

def countdown(i):
    print(i)
    time.sleep(1)
    countdown(i - 1)

countdown(10)

如果你运行上述代码，将发现一个问题：这个函数运行起来没完没了！

> 3...2...1...0...-1...-2...

（要让脚本停止运行，可按Ctrl+C）

编写递归函数时，必须告诉它何时停止递归。正因为如此，每个递归函数都有两部分：基线条件（ base case）和递归条件（ recursive case）。

递归条件指的是函数调用自己，而基线条件则指的是函数不再调用自己，从而避免形成无限循环。

我们来给函数countdown添加基线条件。

python

import time

def countdown(i):
    print(i)
    time.sleep(1)
    if i <= 0:
        return
    else:
        countdown(i - 1)

countdown(10)

现在，这个函数将像预期的那样运行，输出：

10
9
...
2
1
0

3.3 栈 🚀

本节将介绍一个重要的编程概念——调用栈（ call stack）。调用栈不仅对编程来说很重要，使用递归时也必须理解这个概念。

假设你去野外烧烤，并为此创建了一个待办事项清单——一叠便条。

本书之前讨论数组和链表时，也有一个待办事项清单。你可将待办事项添加到该清单的任何地方，还可删除任何一个待办事项。

一叠便条要简单得多：插入的待办事项放在清单的最前面；读取待办事项时，你只读取最上面的那个，并将其删除。

因此这个待办事项清单只有两种操作：压入（插入）和弹出（删除并读取）。

这种数据结构称为栈。栈是一种简单的数据结构，刚才我们一直在使用它，却没有意识到！

3.3.1 调用栈 🚀

计算机在内部使用被称为调用栈的栈。我们来看看计算机是如何使用调用栈的。下面是一个简单的函数。

python

def greet(name):
	print "hello, " + name + "!"
	greet2(name)
	print "getting ready to say bye..."
	bye()

这个函数问候用户，再调用另外两个函数。这两个函数的代码如下。

python

def greet2(name):
	print "how are you, " + name + "?"
def bye():
	print "ok bye!"

下面详细介绍调用函数时发生的情况。

说明
在Python中， print是一个函数，但出于简化考虑，这里假设它不是函数。你也这样假设就行了。

假设你调用greet("maggie")，计算机将首先为该函数调用分配一块内存。

我们来使用这些内存。变量name被设置为maggie，这需要存储到内存中。

每当你调用函数时，计算机都像这样将函数调用涉及的所有变量的值存储到内存中。接下来，你打印hello, maggie!，再调用greet2("maggie")。同样，计算机也为这个函数调用分配一块内存。

计算机使用一个栈来表示这些内存块，其中第二个内存块位于第一个内存块上面。你打印how are you, maggie?，然后从函数调用返回。此时，栈顶的内存块被弹出。

现在，栈顶的内存块是函数greet的，这意味着你返回到了函数greet。当你调用函数greet2时，函数greet只执行了一部分。这是本节的一个重要概念：调用另一个函数时，当前函数暂停并处于未完成状态。该函数的所有变量的值都还在内存中。执行完函数greet2后，你回到函数greet，并从离开的地方开始接着往下执行：首先打印getting ready to say bye…，再调用函数bye。

在栈顶添加了函数bye的内存块。然后，你打印ok bye!，并从这个函数返回。

现在你又回到了函数greet。由于没有别的事情要做，你就从函数greet返回。这个栈用于存储多个函数的变量，被称为调用栈。

练习

3.1 根据下面的调用栈，你可获得哪些信息？

下面来看看递归函数的调用栈。

3.3.2 递归调用栈 🚀

递归函数也使用调用栈！来看看递归函数factorial的调用栈。 factorial(5)写作5!，其定义如下： 5! = 5 * 4 * 3 * 2 * 1。同理， factorial(3)为3 * 2 * 1。下面是计算阶乘的递归函数。

python

def fact(x):
    if x == 1:
    	return 1
    else:
    	return x * fact(x-1)

下面来详细分析调用fact(3)时调用栈是如何变化的。别忘了，栈顶的方框指出了当前执行到了什么地方。

注意，每个fact调用都有自己的x变量。在一个函数调用中不能访问另一个的x变量。栈在递归中扮演着重要角色。在本章开头的示例中，有两种寻找钥匙的方法。下面再次列出了第一种方法。

使用这种方法时，你创建一个待查找的盒子堆，因此你始终知道还有哪些盒子需要查找。

但使用递归方法时，没有盒子堆。

既然没有盒子堆，那算法怎么知道还有哪些盒子需要查找呢？下面是一个例子。

此时，调用栈类似于下面这样。

原来“盒子堆”存储在了栈中！这个栈包含未完成的函数调用，每个函数调用都包含还未检查完的盒子。使用栈很方便，因为你无需自己跟踪盒子堆——栈替你这样做了。

使用栈虽然很方便，但是也要付出代价：存储详尽的信息可能占用大量的内存。每个函数调用都要占用一定的内存，如果栈很高，就意味着计算机存储了大量函数调用的信息。在这种情况下，你有两种选择：

重新编写代码，转而使用循环。
使用尾递归。这是一个高级递归主题，不在本书的讨论范围内。另外，并非所有的语言都支持尾递归。

练习

3.2 假设你编写了一个递归函数，但不小心导致它没完没了地运行。正如你看到的，对于每次函数调用，计算机都将为其在栈中分配内存。递归函数没完没了地运行时，将给栈带来什么影响？

3.4 小结 🚀

递归指的是调用自己的函数。
每个递归函数都有两个条件：基线条件和递归条件。
栈有两种操作：压入和弹出。
所有函数调用都进入调用栈。
调用栈可能很长，这将占用大量的内存。

第3章 递归 ​

3.1 递归 🚀 ​

3.2 基线条件和递归条件 🚀 ​

3.3 栈 🚀 ​

3.3.1 调用栈 🚀 ​

3.3.2 递归调用栈 🚀 ​

3.4 小结 🚀 ​

第3章递归

3.1 递归 🚀

3.2 基线条件和递归条件 🚀

3.3 栈 🚀

3.3.1 调用栈 🚀

3.3.2 递归调用栈 🚀

3.4 小结 🚀