下载
第11章 搜 索 树
本章是关于树结构的最后一章,我们将给出一种适合于描述字典的树形结构。第 7章中的
字典描述仅能提供比较好的平均性能,而在最坏情况下的性能很差。当用跳表来描述一个 n 元
素的字典时,对其进行搜索、插入或者删除操作所需要的平均时间为 O ( l o g n ) ,而最坏情况下
的时间为 (n)。当用散列来描述一个n 元素的字典时,对其进行搜索、插入或者删除操作所需
要的平均和最坏时间分别为 ( l ) 和 (n)。使用跳表很容易对字典元素进行高效的顺序访问
(如按照升序搜索元素),而散列却做不到这一点。当用平衡搜索树来描述一个n 元素的字典时,
对其进行搜索、插入或者删除所需要的平均时间和最坏时间均为 ( l o g n ) ,按元素排名进行的
查找和删除操作所需要的时间为 O ( l o g n ) ,并且所有字典元素能够在线性时间内按升序输出。
正因为这样(无论是平衡还是非平衡搜索树),所以在搜索树中进行顺序访问时,搜索每个元
素所需要的平均时间为 ( l )。
实际上,如果所期望的操作为查找、插入和删除(均根据元素的关键值来进行),则可以
借助于散列函数来实现平衡搜索树。当字典操作仅按关键值来进行时,可将平衡搜索用于那些
对时间要求比较严格的应用,以确保任何字典操作所需要的时间都不会超过指定的时间量。平
衡搜索树也可用于按排名来进行查找和删除操作的情形。对于那些不按精确的关键值匹配进行
字典操作的应用(比如寻找关键值大于k 的最小元素),同样可使用平衡搜索树。
本章将首先介绍二叉搜索树。这种树提供了可与跳表相媲美的渐进复杂性。其搜索、插入
和删除操作的平均时间复杂性为 O ( l o g n),最坏时间复杂性为 (n)。接下来将介绍两种大家比
较熟悉的平衡树:AV L 树和红-黑树。无论哪一种树,其搜索、插入和删除操作都能在对数时
间内完成(平均和最坏情况)。两种结构的实际运行性能也很接近, AV L 树一般稍微快一些。
所有的平衡树结构都使用“旋转”来保持平衡。 AV L 树在执行每个插入操作时最多需要一次旋
转,执行每个删除操作时最多需要 O ( l o gn)次旋转;而红-黑树对于每个插入和删除操作,都需
要执行一次旋转。这种差别对于大多数仅需 ( l )时间进行一次旋转的应用来说无关紧要,但对
于那些不能在常量时间内完成一次旋转的应用来说就非常重要了,比如平衡优先搜索树
McCreight 就是这样一种应用。平衡优先搜索树用于描述具有两个关键值的元素,此时,每个
关键值是一对数(x,y)。它同时是一个关于y 的优先队列和关于 x 的搜索树。在平衡优先搜索树
中执行旋转时,每次旋转都需耗时 O ( l o gn)。如果用红-黑树来描述平衡优先搜索树,由于每一
次插入或删除后仅需执行一次旋转,因此插入或删除操作总的时间复杂性仍保持为 O ( l o g n);
当使用AV L树时,删除操作的时间将变为O ( l o gn )。
如果所描述的字典比较小(能够完全放入内存),AV L树和红-黑树均能提供比较高的性能,
但对于很大的字典来说,它们就不适用了。当字典存储在磁盘上时,需要使用带有更高次数
(因而有更小高度)的搜索树,本章也将介绍一个这样的搜索树—— B-树。
本章的应用部分将给出三个搜索树的应用。第一个是直方图的计算,第二个是 1 0 . 5 . 1节所
介绍的N P-复杂问题——箱子装载,最后一个是关于在电子布线中所出现的交叉分布问题。在
直方图的应用中,使用散列函数来取代搜索树,从而使性能得到提高。在最优匹配箱子装载应
用中,由于搜索不是按精确匹配完成的,所以不能使用散列函数。在交叉分布问题中,操作是
按排名完成的,因此也不能使用散列函数。