就地排序演算法：堆積排序

2023-10-06

堆積排序（heapsort）是一個能在 $O(nL(n))$ 時間內排序 $n$ 個元素的排序演算法，其中 $L(n) = \lceil \log_2 (n \varplus 1) \rceil \period$

由於堆積排序是一種就地（in-place）演算法，且在基於比較的計算模型下具有最佳的時間複雜度，使其成為排序演算法中的一個通用選擇。

本文簡介堆積排序的步驟，並證明其正確性及分析其時間複雜度。

1　術語

本文中，我們會使用一個固定的整數陣列 $A[0 \twodots n \varminus 1] \period$此外，對任意整數 $a \jcomma b \comma$我們定義 \[\begin{split}[a \twodots b] = \{k \in \ZZ: a \leq k \leq b\} \period\end{split}\]

對任意非負整數 $k \comma$我們以 $L(k) = \lceil \log_2 (k \varplus 1) \rceil$ 表示 $k$ 以二進位表示時所需的位數。我們有 \[\begin{split}L(k) = \begin{cases}0 & \when k = 0 \\ 1 \varplus \lfloor \log_2 k \rfloor & \when k \geq 1 \end{cases} \period\end{split}\]

1.1　最大堆積性質

對任意整數 $m \in \{0 \cm 1 \cm \ldots \cm n\} \comma$子陣列 $A[0 \twodots m \varminus 1]$ 稱為 $A[0 \twodots n \varminus 1]$ 的一個前綴。

給定前綴 $A[0 \twodots m \varminus 1]$ 與一索引值 $i \in [0 \twodots m \varminus 1] \comma$若對所有滿足 $2i + d < m$ 的 $d \in \{1, 2\}$ 均有 \[\begin{split}A[2i \varplus d] \leq A[i] \comma\end{split}\]則我們稱索引值 $i$ 在前綴 $A[0 \twodots m \varminus 1]$ 中滿足最大堆積性質（maximum-heap property）。

1.2　最大堆積

若每個索引值 $i \in [0 \twodots m \varminus 1]$ 均在 $A[0 \twodots m \varminus 1]$ 中滿足最大堆積性質，則我們稱前綴 $A[0 \twodots m \varminus 1]$ 為一最大堆積（maximum heap）。

若 $A[0 \twodots m \varminus 1]$ 為最大堆積且 $m \geq 1 \comma$則 $A[0]$ 為 $A[0 \twodots m \varminus 1]$ 中的最大值。

2　演算法

2.1　向後插入

演算法 A（向後插入） 設 $m \in [1 \twodots n] \comma i \in [0 \twodots m \varminus 1] \comma$並假設 $[i \varplus 1 \twodots m \varminus 1]$ 中的每個索引值均在前綴 $A[0 \twodots m \varminus 1]$ 中滿足最大堆積性質。

以下的 $\textsc{SiftForward}(A, m, i)$ 會將前綴 $A[0 \twodots m \varminus 1]$ 重排，使 $[i \twodots m \varminus 1]$ 中的每個索引值均在前綴 $A[0 \twodots m \varminus 1]$ 中滿足最大堆積性質。

備註　也就是說，不破壞 $[i \varplus 1 \twodots m \varminus 1]$ 中索引值在此前綴中的最大堆積性質，且讓 $i$ 在此前綴中也具有最大堆積性質。

$\textsc{SiftForward}(A, m, i) \jcolon$

設 $j \gets i$ 與 $k \gets i \period$
若 $2j + 1 < m$ 且 $A[2j \varplus 1] > A[k] \comma$則設 $k \gets 2j + 1 \period$
若 $2j + 2 < m$ 且 $A[2j \varplus 2] > A[k] \comma$則設 $k \gets 2j + 2 \period$
若 $j \neq k \comma$則交換 $A[\mkern2muj] \leftrightarrow A[k] \comma$接著設 $j \gets k \comma$並回到步驟 2；否則終止演算法。

正確性　首先我們說明每次進入步驟 2 與離開步驟 4 時，下列敘述均成立：

我們有 $j = k \comma$且 $[i \twodots m \varminus 1]$ 中除了 $j$ 以外的索引值均在前綴 $A[0 \twodots m \varminus 1]$ 中滿足最大堆積性質。

我們驗證如下。

首次進入步驟 2 時，$j = i = k \comma$且由輸入的假設可知 $[i \twodots m \varminus 1]$ 中的索引值除了 $i$ 以外均在前綴 $A[0 \twodots m \varminus 1]$ 中滿足最大堆積性質。
假設某次進入步驟 2 時 (a) 成立，且 $j$ 的值為 $j_0 \period$接下來的步驟 2、3 會選擇一個 \[\begin{split}k \in \{\mkern2muj, 2j \varplus 1, 2j \varplus 2\}\end{split}\] 使 $A[k]$ 儘可能最大。如果此時 $j \neq k \comma$則我們會在步驟 4 交換 $A[\.j] \leftrightarrow A[k]$ 並設 $j \gets k \period$因此離開步驟 4 時 $j = k$ 必定成立，且此時 $j_0$ 會在前綴 $A[0 \twodots m \varminus 1]$ 中具有最大堆積性質。此外，由於經過步驟 4 後 $A[\.j_0]$ 的值不會增加，故 $[i \twodots m \varminus 1]$ 中除了 $j_0 \jcomma k$ 以外的索引值仍會在前綴 $A[0 \twodots m \varminus 1]$ 中維持最大堆積性質。也就是說，離開步驟 4 時 (a) 也會成立。

如果演算法會終止，則在之前進入步驟 4 時 $j = k$ 成立，即 $j$ 在前綴 $A[0 \twodots m \varminus 1]$ 中會有最大堆積性質。又因為在離開步驟 4 時 (a) 成立，故演算法終止時的正確性可得證。接著我們需要確認演算法會終止。

由於每次執行步驟 2―4 後，若有回到步驟 2，則 $j$ 的值會變為 $2j_0 + 1$ 以上，其中 $j_0$ 是上一次進入步驟 2 時 $j$ 的值。又因為進入步驟 2 時必須有 $j \leq m - 1 \comma$故演算法必定會結束。至此演算法 A 的正確性得證。

時間複雜度　我們利用步驟 2 的執行次數計算演算法 A 的時間複雜度。對正整數 $t \comma$設 $j_{i-1}$ 為第 $t$ 次進入步驟 2 時 $j$ 的值。我們有 $j_{t+1} \geq 2j_t+1 \comma$故 \[\begin{split}\frac{j_{t+1} + 1}{j_t + 1} \geq \frac{(2j_t + 1)+1}{j_t + 1} = 2 \period\end{split}\] 由 $j_0 = i$ 可知 $j_t \geq 2^t(i \varplus 1) - 1 \period$若步驟 2 共執行 $T$ 次，則由 $j_{T-1} \leq m - 1$ 可知 $2^{T-1}(i \varplus 1) - 1 \leq m - 1 \comma$即 \[\begin{split}T &\leq 1 + \biggl\lfloor\log_2\biggl(\frac{m}{i \varplus 1}\biggr)\biggr\rfloor \\[2ex] &\leq 1 + L(m) - L(i \varplus 1)\period\end{split}\] 故演算法 A 的時間複雜度為 $O(1 + L(m) - L(i \varplus 1)) \period$

2.2　建造堆積

演算法 B（建造堆積） 給定陣列 $A[0 \twodots n \varminus 1] \comma$以下的 $\textsc{BuildHeap}(A, n)$ 會將其重排為一最大堆積。

$\textsc{BuildHeap}(A, n) \jcolon$

設 $i \gets \lfloor n/2 \rfloor - 1 \comma$並跳至步驟 4。
根據演算法 A 執行 $\textsc{SiftForward}(A, n, i) \period$
設 $i \gets i - 1 \period$
若 $i \geq 0 \comma$則回到步驟 2；否則終止演算法。

正確性　首次進入步驟 2 時，$[i \varplus 1 \twodots n \varminus 1]$ 中的索引值均滿足最大堆積性質（因為此時 $i = \lfloor n/2 \rfloor - 1$ 且 $2(i \varplus 1) + 1 \geq n \rparen \mkern-9mu \period$

若每次進入步驟 2 時，$[i \varplus 1 \twodots n \varminus 1]$ 中的索引值均滿足最大堆積性質，則由演算法 A 的正確性可知離開步驟 2 時，$[i \twodots n \varminus 1]$ 中的索引值滿足最大堆積性質。

由此可知演算法結束時，$[0 \twodots n \varminus 1]$ 中的索引值均滿足最大堆積性質，即正確性得證。

時間複雜度　可知步驟 2 以外花費的總時間為 $O(n) \comma$以下我們考慮步驟 2 花費的總時間。對每個索引值 $i \comma$步驟 2 需要花費 $O(1 + L(n) - L(i \varplus 1))$ 的時間。由 \[\begin{split} &\sum_{i=0}^{\lfloor n/2 \rfloor - 1} (1 + L(n) - L(i \varplus 1)) \\ &\leq \sum_{k=0}^{L(n)-1} \sum_{i=2^k-1}^{2^{k+1}-2} (1 + L(n) - L(i \varplus 1)) \\ &= \sum_{k=0}^{L(n)-1} 2^k (1 + L(n) - (k \varplus 1)) \\ &= \sum_{k=0}^{L(n)-1} 2^k (L(n) - k) \\ &= \sum_{h=1}^{L(n)} 2^{L(n) - h}h \\ &\leq 2^{L(n)} \sum_{h \geq 1} \frac{h}{2^h} \\ &\leq 2n \cdot 2 \comma \end{split}\] 可知步驟 2 花費的總時間為 $O(n) \comma$故演算法 B（建造堆積）的時間複雜度為 $O(n) \period$

2.3　拆除堆積

演算法 C（拆除堆積） 給定最大堆積 $A[0 \twodots n \varminus 1] \comma$以下的 $\textsc{DestroyHeap}(A, n)$ 會將其重排為由小到大排列。

$\textsc{DestroyHeap}(A, n) \jcolon$

設 $m \gets n - 1 \comma$並跳至步驟 5。
交換 $A[0] \leftrightarrow A[m] \comma$並設 $i \gets 0 \period$
根據演算法 A 執行 $\textsc{SiftForward}(A, m, i) \period$
設 $m \gets m - 1 \period$
若 $m \geq 1 \comma$則回到步驟 2；否則終止演算法。

正確性　首次進入步驟 2 時，$A[0 \twodots m]$ 為最大堆積，故在交換 $A[0] \leftrightarrow A[m]$ 並進入步驟 3 後，$A[m]$ 即為 $A[0 \twodots m]$ 中的最大值，且在前綴 $A[0 \twodots m \varminus 1]$ 中除了 0 以外的索引值均滿足最大堆積性質。

若進入步驟 3 時，前綴 $A[0 \twodots m \varminus 1]$ 中除了 0 以外的索引值均滿足最大堆積性質，則由演算法 A 的正確性可知離開步驟 3 時，前綴 $A[0 \twodots m \varminus 1]$ 會形成最大堆積。

由此可知演算法結束時，對任意 $i \in [0 \twodots n \varminus 1] \comma$$A[i]$ 均為 $A[0 \twodots i]$ 的最大值。故正確性得證。

時間複雜度　步驟 3 以外花費的總時間為 $O(n) \comma$且步驟 3 花費的總時間為 $O(nL(n)) \comma$故時間複雜度為 $O(nL(n)) \period$

2.4　堆積排序

有了前面的準備工作，現在我們利用演算法 B、C 即可排序陣列。

演算法 D（堆積排序） 給定陣列 $A[0 \twodots n \varminus 1] \comma$以下的 $\textsc{Heapsort}(A, n)$ 會將其重排為由小到大排列。

$\textsc{Heapsort}(A, n) \jcolon$

根據演算法 B 執行 $\textsc{BuildHeap}(A, n) \period$
根據演算法 C 執行 $\textsc{DestroyHeap}(A, n) \period$

正確性　由演算法 B、C 的正確性得證。

時間複雜度　步驟 1 花費時間為 $O(n) \comma$且步驟 2 花費時間為 $O(nL(n)) \comma$故總花費時間為 $O(nL(n)) \period$

3　程式碼實作

以下為 Python 的實作。

from collections.abc import Sequence

def sift_forward(A: Sequence, m: int, i: int) -> None:
    j, k = i, i
    done = False
    while not ok:
        if j * 2 + 1 < m and A[j * 2 + 1] > A[k]:
            k = j * 2 + 1
        if j * 2 + 2 < m and A[j * 2 + 2] > A[k]:
            k = j * 2 + 2
        if j != k:
            A[j], A[k] = A[k], A[j]
            j = k
        else:
            done = True

def build_heap(A: Sequence) -> None:
    n = len(A)
    for i in range(n // 2 - 1, -1, -1):
        sift_forward(A, n, i)

def destroy_heap(A: Sequence) -> None:
    n = len(A)
    for m in range(n - 1, 0, -1):
        A[0], A[m] = A[m], A[0]
        sift_forward(A, m, 0)

def heapsort(A: Sequence) -> None:
    build_heap(A)
    destroy_heap(A)

參考資料

Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest, and Clifford Stein. Introduction to algorithms. MIT press, third edition, 2009.

就地排序演算法：堆積排序

1 術語

1.1 最大堆積性質

1.2 最大堆積

2 演算法

2.1 向後插入

2.2 建造堆積

2.3 拆除堆積

2.4 堆積排序

3 程式碼實作