CLUSTER

PostgreSQL User's Guide
Prev		Next

Synopsis

CLUSTER indexname ON table

入力

indexname: インデックス名。
table: テーブル名。

出力

CLUSTER: クラスタリングに成功した場合。
ERROR: relation <tablerelation_number> inherits "table"
ERROR: Relation table does not exist!

説明

CLUSTER は Postgres に table で指定されたクラスを indexname で指定されたインデックスに基づいてクラスタリングするように指示します。このインデックスは classname に対して定義されていなければなりません。

クラスがクラスタリングされた場合、インデックス情報に基づいた物理的な順番付けが再度行なわれます。クラスタリングは静的なものです。言い替えると、クラスが更新された時、その変更はクラスタリングされません。新しいインスタンスや更新されたタプルをクラスタリング状態を維持するような処理は行なわれません。維持させるためには、手作業でこのコマンドを再発行して、再度クラスタリングを行なうことで可能です。

注意

実際には、テーブルは一時テーブルにインデックスの順番でコピーされ、そして、元の名前に戻されます。このため、クラスタリングが行なわれると、与えられた全ての権限と他のインデックスは破棄されます。

テーブル内の 1 つの行にランダムにアクセスする場合、ヒープテーブルにおけるデータの実際の順番は重要ではありません。しかし、他のデータよりもある特定のデータへのアクセスが頻繁で、それらをグループにまとめたインデックスがある場合、 CLUSTER を使用する効果があります。

CLUSTER が役に立つ他の点は、インデックスを使用してテーブルから複数の行を取り出す場合です。インデックスが一致する最初の行を持つヒープページを一度識別すれば、一致する他の全ての行はおそらく同一のヒープページにあることになります。これにより、ディスクアクセスの回数が節約でき、問い合わせの速度が向上しますので、テーブルからインデックスされた値の範囲を要求する場合や、複数の行が 1 つのインデックスされた値に一致する場合、 CLUSTER は役に立ちます。

データをクラスタリングするには、2 つの方法があります。 1 つ目は CLUSTER コマンドを使用して、指定したインデックスの順番で元のテーブルを再順番付けすることです。行はインデックスの順番でヒープから入手されますが、ヒープテーブルが順序付けされていない場合は、項目はランダムなページに存在することになります。ですので、行を移動する毎に 1 つのディスクページの入手が行なわれますこのため、これは大きなテーブルの場合はより遅くなります。 Postgres にはキャッシュがありますが、大きなテーブルの大部分はキャッシュには収まりません。

データをクラスタリングする他の方法は、

SELECT columnlist INTO TABLE newtable
     FROM table ORDER BY columnlist

を使用することです。これは、インデックスに一致させるために ORDER BY 句の Postgres のソート用コードを使用していますので、順序付けされていないデータに対してかなり高速になります。そして、古いテーブルを削除し、 ALTER TABLE/RENAME を使用して、 temp を元の名前に変更し、全てのインデックスを再作成します。 OID が保持されないことが唯一の問題です。この後、ほとんどのヒープデータは既に順序付けされていますし、既存のインデックスが使用されますので、 CLUSTER は高速になるはずです。

Prev	Home	Next
CLOSE	Up	COMMENT

CLUSTER

Name

Synopsis

入力

出力

説明

注意

使用法

互換性

SQL92