intarray
モジュールはNULLのない整数の配列の操作に便利な関数と演算子を多く提供します。
また、一部の演算子を使用したインデックス検索をサポートします。
配列にNULL要素が一つでも含まれていれば、これらの操作はすべてエラーを発生します。
これらの操作の多くは一次元配列に対してのみ適当なものです。 高次元の入力配列を受け付けますが、データは格納された順の一次元の配列であるかのように扱われます。
このモジュールは「trusted」と見なされます。つまり、現在のデータベースに対してCREATE
権限を持つ非スーパーユーザがインストールできます。
intarray
の関数および演算子 #
intarray
モジュールで提供される関数を表 F.9に、演算子を表 F.10に示します。
表F.9 intarray
関数
表F.10 intarray
演算子
演算子 説明 |
---|
配列が重なるか(少なくとも1つの共通要素があるか)。 |
左辺の配列は右辺の配列を含むか。 |
左辺の配列は右辺の配列に含まれるか。 |
配列内の要素数を返します。 |
右辺の引数に最初に一致する要素番号を、一致するものがなければ0を返します。
( |
要素を配列の末尾に追加します。 |
配列を連結します。 |
配列から右辺の引数に一致する項目を削除します。 |
左辺の配列から右辺の配列要素を削除します。 |
引数の結合を計算します。 |
引数の結合を計算します。 |
引数の共通部分を計算します。 |
配列が問い合わせを満たすか。(下記参照) |
配列が問い合わせを満たすか。( |
演算子&&
、@>
と<@
は、これらはNULLを含まない整数配列のみで動作し、組み込み演算子はどの配列型に対しても動作する点を除き、同じ名前のPostgreSQLの組み込み演算子とそれぞれほぼ等価です。
この制限により、多くの場合、組み込み演算子より高速です。
@@
および~~
演算子は、配列が特化したデータ型query_int
で表現される問い合わせを満たすかどうかを試験します。
問い合わせは、おそらく&
(論理積)、|
(論理和)、!
(否定)演算子を組み合わせて使用した、配列要素に対して検査される整数値からなります。
例えば1&(2|3)
という問い合わせは1および、2か3のいずれかを含む配列に一致します。
intarray
は&&
、@>
、@@
演算子に関して通常の配列等価性と同様にインデックスサポートを提供します。
2つのパラメータ化されたGiSTインデックス演算子クラスが提供されます。
gist__int_ops
(デフォルトで使用されます)は小中規模要素数のデータセットに適します。
一方、gist__intbig_ops
はより大きな署名を使用しますので、大規模データセット(つまり、異なった配列値を多数持つ列)のインデックスにより適しています。
実装は組み込みの非可逆圧縮を持ったRD-treeデータ構造を使用します。
gist__int_ops
は整数の集合を整数の範囲の配列として近似します。
オプションの整数パラメータnumranges
は、一つのインデックスキー内の範囲の最大数を決定します。
numranges
のデフォルト値は100です。
有効な値は1から253までです。
GiSTインデックスキーとしてより大きな値を使うと、インデックスはより大きくなってしまいますが、(インデックスのより小さな部分とより少ないヒープページを走査することで)検索がより正確になります。
gist__intbig_ops
は整数の集合をビットマップ署名として近似します。
オプションの整数パラメータsiglen
は、署名の長さをバイト単位で決定します。
デフォルトの署名の長さは16バイトです。
署名の長さの有効な値は1から2024バイトまでです。
長い署名では、インデックスはより大きくなってしまいますが、(インデックスのより小さな部分とより少ないヒープページを走査することで)検索がより正確になります。
また、デフォルトではないGIN演算子クラスgin__int_ops
も存在し、<@
と同様にこれらの演算子をサポートします。
GiSTおよびGINインデックスのどちらを選択するかは、別途説明されるGiSTとGINの相対的な性能特徴に依存します。
-- メッセージ(message)は1つ以上の「節(section)」の中にある
CREATE TABLE message (mid INT PRIMARY KEY, sections INT[], ...);
-- 署名の長さが32バイトの特化したインデックスを作成
CREATE INDEX message_rdtree_idx ON message USING GIST (sections gist__intbig_ops (siglen = 32));
-- 節1 OR 2のメッセージを選択 - OVERLAP演算子
SELECT message.mid FROM message WHERE message.sections && '{1,2}';
-- 節1 AND 2のメッセージを選択 - CONTAINS演算子
SELECT message.mid FROM message WHERE message.sections @> '{1,2}';
-- 同上、QUERY演算子を使用
SELECT message.mid FROM message WHERE message.sections @@ '1&2'::query_int;
ソースディレクトリ以下のcontrib/intarray/bench
にはベンチマーク試験一式があり、インストールされたPostgreSQLサーバで実行できます。
(DBD::Pg
もインストールされていないといけません。)
以下のように実行します。
cd .../contrib/intarray/bench createdb TEST psql -c "CREATE EXTENSION intarray" TEST ./create_test.pl | psql TEST ./bench.pl
bench.pl
スクリプトには多くのオプションがあります。
これらは引数を付けずに実行すると表示されます。
Teodor Sigaev (<teodor@sigaev.ru>
)とOleg Bartunov (<oleg@sai.msu.su>
)によりすべての作業がなされました。
さらなる情報についてはhttp://www.sai.msu.su/~megera/postgres/gist/を参照してください。
Andrey Oktyabrskiは新しい関数、演算子の追加において素晴らしい作業を行いました。