クイックソート実装・詳しい計算量解説

2026/04/29

Cover Image for クイックソート実装・詳しい計算量解説

クイックソート(Quick Sort)

このサイトでのクイックソートの定義は以下の通りです。¹

計算量 $O(N \log N)$

クイックソートのアルゴリズム

クイックソートは、分割統治法を用いた効率的なソートアルゴリズムです。以下の手順で動作します。

配列の中から一つの要素を「ピボット」として選択します。(このサイトでは配列の一番左をピボットとします。)
ピボットを基準にして、配列を「ピボットより小さい要素」と「ピボットより大きい要素」の二つのサブ配列に分割します。
サブ配列に対して再帰的にクイックソートを適用します。

quick_sort

これを繰り返すことで、配列が整列されます。

2. サブ配列に分割

ピボットを除いた、配列の左端を i、右端を j とします。

i のデータがピボットより小さい間、i を増加させます。
j のデータがピボットより大きい間、j を減少させます。
邪魔なデータがあり、止まったら i と j のデータを交換します。

これを繰り返すと、ピボットより小さい要素と大きい要素に分かれます。

つまり、そのサブ配列の間にピボットが入ることが確定できます。

3. 再帰的にソート

移動させたピボットの左右の分割されたサブ配列に対して、再帰的にクイックソートを適用します。

実装例

以下に C 言語での実装例を示します。

void quickSort(int *d, int left, int right) {
    if (left < right) {
        int pivot = d[left];
        int i = left + 1;
        int j = right;
 
        while (1) {
            while (i <= right && d[i] <= pivot) {
                i++;
            }
            while (j >= left + 1 && d[j] > pivot) {
                j--;
            }
            if (i > j) {
                break;
            }
            // ピボットより大きい要素と小さい要素に分かれるように邪魔なもの同士を交換
            int temp = d[i];
            d[i] = d[j];
            d[j] = temp;
        }
 
        // ピボットをサブ配列との間に移動
        d[left] = d[j];
        d[j] = pivot;
 
        // 再帰的にソート
        quickSort(d, left, j - 1);
        quickSort(d, j + 1, right);
    }
}

クイックソートの計算量

今回はクイックソートの平均計算量について議論します。

クイックソートは、配列を分割し、分割された部分を再帰的にソートするアルゴリズムです。

平均の比較回数について着目し、計算量の議論を行います。

平均計算量

クイックソートで、発生する比較回数を $Q(N)$ とします。

クイックソートの比較回数はデータに依存するため、サブ配列を $a$ と $b$ に分割した場合、以下のような式が成り立ちます。

Q(N) = N-1 + Q(a) + Q(b)

この式からすべてのケースを考慮し、平均値を求めると以下のような式が成り立ちます。

\begin{align*} Q(N) &= N-1 + Q(0) + Q(N-1) \\ Q(N) &= N-1 + Q(1) + Q(N-2) \\ \vdots & \\ Q(N) &= N-1 + Q(N-1) + Q(0) \\ \end{align*}

$N$ 個のこの式をすべて足して、 $N$ で割ると以下のような式が成り立ちます。

Q(N) = (N-1)+\frac{2}{N} \sum_{k=0}^{N-1} Q(k)

この式を変形すると以下のようになります。(1)式

NQ(N) = N(N-1)+2\sum_{k=0}^{N-1} Q(k)

N が N-1 のとき以下 (2)式

(N-1)Q(N-1) = (N-1)(N-2)+2\sum_{k=0}^{N-2} Q(k)

(1)式を(2)式で引くと以下のようになります。

NQ(N) - (N-1)Q(N-1) = 2N-2+2Q(N-1) \\

この式を整理すると以下のようになります。

\begin{align*} NQ(N) &= (N+1)Q(N-1)+2(N-1) \\ \frac{Q(N)}{N+1} &= \frac{Q(N-1)}{N} + \frac{2(N-1)}{N(N+1)} \\ \frac{Q(N)}{N+1} &= \frac{Q(N-1)}{N} + \frac{4}{N+1} - \frac{2}{N} \\ \end{align*}

$R(N) = \frac{Q(N)}{N+1}$ とおくと、以下のようになります。

\begin{align*} R(N) &= R(N-1) + \frac{4}{N+1} - \frac{2}{N} \\ &\vdots \\ R(3) &= R(2) + \frac{4}{4} - \frac{2}{3} \\ R(2) &= \frac{Q(2)}{2+1}=\frac{1}{3} \\ \end{align*}

よって $R(N)$ は

R(N)=2\sum_{k=1}^{N} \frac{1}{k}-\frac{4N}{N+1}

この式に $N+1$ をかけると $Q(N)$ が求まります。

Q(N)=2(N+1)\sum_{k=1}^{N}\frac{1}{k}-4N

$\frac{1}{k}$ の和は積分を求め、近似することで以下のようになります。

\sum_{k=1}^{N}\frac{1}{k} \approx \log N

よって、クイックソートの平均計算量は以下のようになります。

\begin{align*} Q(N)&=2(N+1)\log N+2(N+1)-4N\\ &=2N\log N+2\log N+2-2N\\ &\approx 2N\log N\\ \end{align*}

したがって、クイックソートの平均計算量は $O(N \log N)$ となります。

クイックソートは、データの分布やピボットの選択方法によっては最悪計算量が $O(N^2)$ になる場合もありますが、一般的には非常に効率的なソートアルゴリズムとして広く利用されています。

クイックソートは、安定なソートではありませんが、インプレースソート（追加のメモリをほとんど使用しない）であり、大規模なデータセットに対しても高速に動作します。

以上がクイックソートの基本的な解説と C 言語での実装、および計算量の議論でした。

(補足)計算量における log の底について

ここからは計算量の議論についての補足です。

ここで、 $\log$ の底について考えてみましょう。

計算量の議論では、 $\log$ の底は基本的に問題になりません。

なぜなら、 $\log$ の底が異なる場合でも、それは定数倍の違いに過ぎないためです。

例えば、 $\log_2 N$ と $\log_{10} N$ では、 $\log_{10} N = \frac{\log_2 N}{\log_2 10}$ となります。

$\log_2 10$ は定数なので、 $\log_2 N$ と $\log_{10} N$ の計算量は同じと考えることができます。

関連記事

ソートアルゴリズムを一覧で比較したい方はソートアルゴリズム比較・計算量まとめをご覧ください。

それぞれのソートアルゴリズムの定義は、他のサイトや書籍等での定義と少々異なる場合があります。 ↩

おすすめ記事

Cover Image for AHC034 初参戦記

AHC034 初参戦記

Atcoder Heuristic Contest 034 に参加しました。AHC初心者記事を少しばかり見ただけですがそこそこの結果になりました。ヒューリスティックには初参加だったので参加した記録の記事です。

二分探索(Binary Search)実装・詳しい計算量解説｜C言語

二分探索(Binary Search)の仕組み、C言語での最適な実装、数式を用いた計算量 O(log N) の導出を詳しく解説します。ソート済み配列から目的の値を高速に探索する代表的なアルゴリズムです。

Cover Image for 挿入ソート実装・詳しい計算量解説

挿入ソート実装・詳しい計算量解説

挿入ソート(Insertion Sort)の説明、C言語での実装、数式を用いた計算量の議論を解説します挿入ソートはデータ配列のはじめから終わりまで、ソート済みの部分と未ソートの部分に分け、未ソートの部分から一つずつ取り出して、ソート済みの部分に挿入していくアルゴリズムです。計算量はO(N^2)です。