★PostgreSQLカンファレンス2024 12月6日開催/チケット販売中★
他のバージョンの文書 16 | 15 | 14 | 13 | 12 | 11 | 10 | 9.6 | 9.5 | 9.4 | 9.3 | 9.2 | 9.1 | 9.0 | 8.4 | 8.3 | 8.2 | 8.1 | 8.0 | 7.4 | 7.3 | 7.2

F.20. intarray — 整数の配列を操作する #

intarrayモジュールはNULLのない整数の配列の操作に便利な関数と演算子を多く提供します。 また、一部の演算子を使用したインデックス検索をサポートします。

配列にNULL要素が一つでも含まれていれば、これらの操作はすべてエラーを発生します。

これらの操作の多くは一次元配列に対してのみ適当なものです。 高次元の入力配列を受け付けますが、データは格納された順の一次元の配列であるかのように扱われます。

このモジュールはtrustedと見なされます。つまり、現在のデータベースに対してCREATE権限を持つ非スーパーユーザがインストールできます。

F.20.1. intarrayの関数および演算子 #

intarrayモジュールで提供される関数を表 F.9に、演算子を表 F.10に示します。

表F.9 intarray関数

関数

説明

icount ( integer[] ) → integer

配列内の要素数を返します。

icount('{1,2,3}'::integer[])3

sort ( integer[], dir text ) → integer[]

昇順または降順に配列をソートします。 dirascまたはdescのいずれかでなければなりません。

sort('{1,3,2}'::integer[], 'desc'){3,2,1}

sort ( integer[] ) → integer[]

sort_asc ( integer[] ) → integer[]

昇順にソートします。

sort(array[11,77,44]){11,44,77}

sort_desc ( integer[] ) → integer[]

降順にソートします。

sort_desc(array[11,77,44]){77,44,11}

uniq ( integer[] ) → integer[]

隣接する重複を削除します。 すべての重複を削除するために、しばしばsortと一緒に用いられます。

uniq('{1,2,2,3,1,1}'::integer[]){1,2,3,1}

uniq(sort('{1,2,3,2,1}'::integer[])){1,2,3}

idx ( integer[], item integer ) → integer

itemに最初に一致する要素番号を、一致するものがなければ0を返します。

idx(array[11,22,33,22,11], 22)2

subarray ( integer[], start integer, len integer ) → integer[]

startの位置から始まりlen個の要素の部分配列を取り出します。

subarray('{1,2,3,2,1}'::integer[], 2, 3){2,3,2}

subarray ( integer[], start integer ) → integer[]

startの位置から始まる部分配列を取り出します。

subarray('{1,2,3,2,1}'::integer[], 2){2,3,2,1}

intset ( integer ) → integer[]

単一要素の配列を作成します。

intset(42){42}


表F.10 intarray演算子

演算子

説明

integer[] && integer[]boolean

配列が重なるか(少なくとも1つの共通要素があるか)。

integer[] @> integer[]boolean

左辺の配列は右辺の配列を含むか。

integer[] <@ integer[]boolean

左辺の配列は右辺の配列に含まれるか。

# integer[]integer

配列内の要素数を返します。

integer[] # integerinteger

右辺の引数に最初に一致する要素番号を、一致するものがなければ0を返します。 (idx関数と同じです。)

integer[] + integerinteger[]

要素を配列の末尾に追加します。

integer[] + integer[]integer[]

配列を連結します。

integer[] - integerinteger[]

配列から右辺の引数に一致する項目を削除します。

integer[] - integer[]integer[]

左辺の配列から右辺の配列要素を削除します。

integer[] | integerinteger[]

引数の結合を計算します。

integer[] | integer[]integer[]

引数の結合を計算します。

integer[] & integer[]integer[]

引数の共通部分を計算します。

integer[] @@ query_intboolean

配列が問い合わせを満たすか。(下記参照)

query_int ~~ integer[]boolean

配列が問い合わせを満たすか。(@@の交代演算子)


演算子&&@><@は、これらはNULLを含まない整数配列のみで動作し、組み込み演算子はどの配列型に対しても動作する点を除き、同じ名前のPostgreSQLの組み込み演算子とそれぞれほぼ等価です。 この制限により、多くの場合、組み込み演算子より高速です。

@@および~~演算子は、配列が特化したデータ型query_intで表現される問い合わせを満たすかどうかを試験します。 問い合わせは、おそらく&(論理積)、| (論理和)、! (否定)演算子を組み合わせて使用した、配列要素に対して検査される整数値からなります。 例えば1&(2|3)という問い合わせは1および、2か3のいずれかを含む配列に一致します。

F.20.2. インデックスサポート #

intarray&&@>@@演算子に関して通常の配列等価性と同様にインデックスサポートを提供します。

2つのパラメータ化されたGiSTインデックス演算子クラスが提供されます。 gist__int_ops(デフォルトで使用されます)は小中規模要素数のデータセットに適します。 一方、gist__intbig_opsはより大きな署名を使用しますので、大規模データセット(つまり、異なった配列値を多数持つ列)のインデックスにより適しています。 実装は組み込みの非可逆圧縮を持ったRD-treeデータ構造を使用します。

gist__int_opsは整数の集合を整数の範囲の配列として近似します。 オプションの整数パラメータnumrangesは、一つのインデックスキー内の範囲の最大数を決定します。 numrangesのデフォルト値は100です。 有効な値は1から253までです。 GiSTインデックスキーとしてより大きな値を使うと、インデックスはより大きくなってしまいますが、(インデックスのより小さな部分とより少ないヒープページを走査することで)検索がより正確になります。

gist__intbig_opsは整数の集合をビットマップ署名として近似します。 オプションの整数パラメータsiglenは、署名の長さをバイト単位で決定します。 デフォルトの署名の長さは16バイトです。 署名の長さの有効な値は1から2024バイトまでです。 長い署名では、インデックスはより大きくなってしまいますが、(インデックスのより小さな部分とより少ないヒープページを走査することで)検索がより正確になります。

また、デフォルトではないGIN演算子クラスgin__int_opsも存在し、<@と同様にこれらの演算子をサポートします。

GiSTおよびGINインデックスのどちらを選択するかは、別途説明されるGiSTとGINの相対的な性能特徴に依存します。

F.20.3. 例 #


-- メッセージ(message)は1つ以上の節(section)の中にある
CREATE TABLE message (mid INT PRIMARY KEY, sections INT[], ...);


-- 署名の長さが32バイトの特化したインデックスを作成
CREATE INDEX message_rdtree_idx ON message USING GIST (sections gist__intbig_ops (siglen = 32));


-- 節1 OR 2のメッセージを選択 - OVERLAP演算子
SELECT message.mid FROM message WHERE message.sections && '{1,2}';


-- 節1 AND 2のメッセージを選択 - CONTAINS演算子
SELECT message.mid FROM message WHERE message.sections @> '{1,2}';


-- 同上、QUERY演算子を使用
SELECT message.mid FROM message WHERE message.sections @@ '1&2'::query_int;

F.20.4. ベンチマーク #

ソースディレクトリ以下のcontrib/intarray/benchにはベンチマーク試験一式があり、インストールされたPostgreSQLサーバで実行できます。 (DBD::Pgもインストールされていないといけません。) 以下のように実行します。

cd .../contrib/intarray/bench
createdb TEST
psql -c "CREATE EXTENSION intarray" TEST
./create_test.pl | psql TEST
./bench.pl

bench.plスクリプトには多くのオプションがあります。 これらは引数を付けずに実行すると表示されます。

F.20.5. 作者 #

Teodor Sigaev ()とOleg Bartunov ()によりすべての作業がなされました。 さらなる情報についてはhttp://www.sai.msu.su/~megera/postgres/gist/を参照してください。 Andrey Oktyabrskiは新しい関数、演算子の追加において素晴らしい作業を行いました。