SQL関数は、任意のSQL文のリストを実行し、そのリストの最後の問い合わせの結果を返します。
単純な(集合ではない)場合、最後の問い合わせの結果の最初の行が返されます。
(複数行の結果のうちの「最初の行」は、ORDER BY
を使用しない限り定義付けることができないことを覚えておいてください。)
最後の問い合わせが何も行を返さない時はNULL値が返されます。
他にも、SQL関数は、SETOF
sometype
型を返すように指定すること、または同意のRETURNS TABLE(
と宣言することにより、集合(つまり複数の行)を返すように宣言することもできます。
この場合、最後の問い合わせの結果のすべての行が返されます。
詳細は後で説明します。
columns
)
SQL関数の本体は、セミコロンで区切ったSQL文のリストでなければなりません。
最後の文の後のセミコロンは省略可能です。
関数がvoid
を返すものと宣言されていない限り、最後の文はSELECT
、またはRETURNING
句を持つINSERT
、UPDATE
、またはDELETE
でなければなりません。
SQL言語で作成された、任意のコマンド群はまとめて、関数として定義することができます。
SELECT
問い合わせ以外に、データ変更用の問い合わせ(つまり、INSERT
、UPDATE
、DELETE
)やその他のSQLコマンドを含めることができます。
(SQL関数ではCOMMIT
、SAVEPOINT
などのトランザクション制御コマンドおよびVACUUM
などのユーティリティコマンドは使用することはできません。)
しかし、最後のコマンドは、関数の戻り値型として定義したものを返すSELECT
、またはRETURNING
句があるものでなければなりません。
その他にも、何か動作をさせるが、有用な値を返さないSQL関数を定義したいのであれば、void
を返すものと定義することで実現可能です。
たとえば、以下の関数はemp
テーブルから負の給料となっている行を削除します。
CREATE FUNCTION clean_emp() RETURNS void AS ' DELETE FROM emp WHERE salary < 0; ' LANGUAGE SQL; SELECT clean_emp(); clean_emp ----------- (1 row)
SQL関数の本体全体は、その一部が実行される前に解析されます。
SQL関数はシステムカタログを変更するコマンド(例えばCREATE TABLE
)を含むことができますので、そのようなコマンドの効果は関数の以降のコマンドの解析中は可視ではありません。
それゆえ、例えば、CREATE TABLE foo (...); INSERT INTO foo VALUES(...);
は単一のSQL関数にまとめられていると期待したようには動作しません。INSERT
コマンドが解析されている時にはfoo
がまだ存在しないからです。
このような場合にはSQL関数の代わりにPL/pgSQLを使うことを薦めます。
CREATE FUNCTION
コマンドの構文では、関数本体は文字列定数として作成される必要があります。
この文字列定数の記述には、通常、ドル引用符付け(4.1.2.4)が最も便利です。
文字列定数を単一引用符で括る通常の構文では、関数本体中で使用される単一引用符('
)とバックスラッシュ(\
)(エスケープ文字列構文を仮定)を二重にしなければなりません(4.1.2.1を参照)。
SQL関数の引数は関数本体内で名前または番号を用いて参照することができます。 両方の方法の例を後で示します。
名前を使用するためには、関数引数を名前を持つものとして宣言し、その名前を関数本体内で記述するだけです。
引数名が関数内の現在のSQLコマンドにおける任意の列名と同じ場合は、列名が優先されます。
これを上書きするためには、
のように、引数名を関数自身の名前を付けて修飾してください。
(もしこれも修飾された列名と競合する場合は、列名が優先されます。
SQLコマンド内でテーブルに他の別名を付けることで、この曖昧さを防止することができます。)
function_name
.argument_name
古い番号による方法では、引数は関数本体内で$
という構文を用いて表すことができます。
つまり、$1は第1引数を示し、$2は第2引数のようになります。
これは特定の引数が名前付きで宣言されているかどうかに関係なく動作します。
n
引数が複合型の場合、
やargname
.fieldname
$1.
のようなドット表記を用いて引数の属性にアクセスすることができます。
ここでも、引数名を持つ形式で曖昧さが発生する場合には関数名で引数名を修飾してください。
fieldname
SQL関数の引数は、識別子としてではなく、データ値としてのみ使用することができます。 したがって、例えば
INSERT INTO mytable VALUES ($1);
は正しいものですが、以下は動作しません。
INSERT INTO $1 VALUES (42);
SQL関数の引数を参照するために名前を使用できる機能は、PostgreSQL 9.2で追加されました。
これより古いサーバ内で使われる関数は$
記法を使用しなければなりません。
n
最も簡単なSQL関数は、引数を取らずに単にinteger
のような基本型を返すものです。
CREATE FUNCTION one() RETURNS integer AS $$ SELECT 1 AS result; $$ LANGUAGE SQL; -- 文字列リテラルの別の構文では CREATE FUNCTION one() RETURNS integer AS ' SELECT 1 AS result; ' LANGUAGE SQL; SELECT one(); one ----- 1
関数本体内で関数の結果用に列の別名を(result
という名前で)定義したことに注目してください。
しかし、この列の別名はこの関数の外部からは可視ではありません。
したがって、その結果はresult
ではなく、one
というラベルで表示されています。
基本型を引数として取る、SQL関数を定義することはほとんどの場合簡単です。
CREATE FUNCTION add_em(x integer, y integer) RETURNS integer AS $$ SELECT x + y; $$ LANGUAGE SQL; SELECT add_em(1, 2) AS answer; answer -------- 3
この他に、引数に名前を付けることを省くことができます。この場合は番号を使用します。
CREATE FUNCTION add_em(integer, integer) RETURNS integer AS $$ SELECT $1 + $2; $$ LANGUAGE SQL; SELECT add_em(1, 2) AS answer; answer -------- 3
以下にもう少し役に立つ関数を示します。 これは銀行口座からの引き落としに使用できます。
CREATE FUNCTION tf1 (accountno integer, debit numeric) RETURNS numeric AS $$ UPDATE bank SET balance = balance - debit WHERE accountno = tf1.accountno; SELECT 1; $$ LANGUAGE SQL;
以下のように、ユーザはこの関数を使用して、口座番号17から100ドルを引き出すことが可能です。
SELECT tf1(17, 100.0);
この例では、第一引数の名前にaccountno
を選びましたが、これはbank
テーブルの列の名前と同じです。
UPDATE
コマンドの中では、accountno
はbank.accountno
列を参照しますので、引数を参照するためにはtf1.accountno
を使用しなければなりません。
もちろんこれは、引数に別の名前を使用することで防ぐことができます。
実際には、関数の結果を定数1よりもわかりやすい形にするために、以下のように定義するとよいでしょう。
CREATE FUNCTION tf1 (accountno integer, debit numeric) RETURNS numeric AS $$ UPDATE bank SET balance = balance - debit WHERE accountno = tf1.accountno; SELECT balance FROM bank WHERE accountno = tf1.accountno; $$ LANGUAGE SQL;
これは残高を調整し、更新後の残高を返します。
同じことはRETURNING
を使用して1つのコマンドで行えます。
CREATE FUNCTION tf1 (accountno integer, debit numeric) RETURNS numeric AS $$ UPDATE bank SET balance = balance - debit WHERE accountno = tf1.accountno RETURNING balance; $$ LANGUAGE SQL;
SQL関数の最後のSELECT
句やRETURNING
句が関数で定義された結果型を正確に返さない場合、PostgreSQLは可能な場合に暗黙的キャストまたは代入キャストで必要な型に自動でキャストします。
そうでない場合は明示的にキャストをする必要があります。
例えば、前出のadd_em
関数が代わりにfloat8
型を返して欲しいとします。
次のように記述すれば十分です。
CREATE FUNCTION add_em(integer, integer) RETURNS float8 AS $$ SELECT $1 + $2; $$ LANGUAGE SQL;
integer
の和はfloat8
に暗黙キャストできるからです。
(キャストについての詳細は第10章またはCREATE CASTを参照して下さい)。
関数の引数に複合型を記述した場合、必要な引数を指定するだけではなく、必要とする引数の属性(フィールド)も指定する必要があります。
例えば、emp
が従業員データを持つテーブルとすると、この名前はそのテーブル内の各行を表す複合型の名前でもあります。
以下に示すdouble_salary
関数は、該当する従業員の給料が倍増したらどうなるかを計算します。
CREATE TABLE emp ( name text, salary numeric, age integer, cubicle point ); INSERT INTO emp VALUES ('Bill', 4200, 45, '(2,1)'); CREATE FUNCTION double_salary(emp) RETURNS numeric AS $$ SELECT $1.salary * 2 AS salary; $$ LANGUAGE SQL; SELECT name, double_salary(emp.*) AS dream FROM emp WHERE emp.cubicle ~= point '(2,1)'; name | dream ------+------- Bill | 8400
$1.salary
という構文を使用して、引数の行値の1フィールドを選択していることに注目してください。
また、table_name
.*
を使用したSELECT
コマンドの呼び出しでは、複合型の値として、現在のテーブル行全体を表すテーブル名を使用していることにも注目してください。
別の方法として、テーブル行は以下のようにテーブル名だけを使用して参照することができます。
SELECT name, double_salary(emp) AS dream FROM emp WHERE emp.cubicle ~= point '(2,1)';
しかし、この使用方法は混乱しやすいためお勧めしません。 (テーブル行の複合型の値に対するこの二つの表記の詳細は8.16.5を参照してください)
その場で複合型の引数値を作成することが便利な場合があります。
これはROW
式で行うことができます。
例えば、以下のようにして関数に渡すデータを調整することができます。
SELECT name, double_salary(ROW(name, salary*1.1, age, cubicle)) AS dream FROM emp;
複合型を返す関数を作成することもできます。
以下に単一のemp
行を返す関数の例を示します。
CREATE FUNCTION new_emp() RETURNS emp AS $$ SELECT text 'None' AS name, 1000.0 AS salary, 25 AS age, point '(2,2)' AS cubicle; $$ LANGUAGE SQL;
ここでは、各属性を定数で指定していますが、この定数を何らかの演算に置き換えることもできます。
関数を定義する上で、2つの重要な注意点を以下に示します。
問い合わせにおける選択リストの順番は、複合型に列が現れる順番と正確に一致する必要があります。 (上で行ったように列に名前を付けても、システムは認識しません。)
各式の型が対応する複合型の列にキャスタができるようにする必要があります。 さもなくば、以下のようなエラーとなります。
ERROR: return type mismatch in function declared to return emp
DETAIL: Final statement returns text instead of point at column 4.
基本型の場合と同様に、システムは明示的キャストを自動では挿入せず、暗黙または代入キャストのみをします。
同じ関数を以下のように定義することもできます。
CREATE FUNCTION new_emp() RETURNS emp AS $$ SELECT ROW('None', 1000.0, 25, '(2,2)')::emp; $$ LANGUAGE SQL;
ここで、正しい複合型の単一の列を単に返すSELECT
を記述しました。
今回の例ではこれはより優れたものとはいえませんが、例えば、必要な複合値を返す他の関数を呼び出して結果を計算しなければならない場合など、便利な解法になることがあります。
他の例としては、単なる複合型ではなく複合型のドメインを返す関数を書こうとしてる場合に、単一列を返すように書くことが常に必要となります。
なぜなら、行全体の結果を強制する方法がないからです。
この関数を、評価式で使って直接呼び出せますし、
SELECT new_emp(); new_emp -------------------------- (None,1000.0,25,"(2,2)")
テーブル関数として呼び出しても直接呼び出せます。
SELECT * FROM new_emp(); name | salary | age | cubicle ------+--------+-----+--------- None | 1000.0 | 25 | (2,2)
2番目の方法については、37.5.7でより詳しく説明します。
複合型を返す関数を使用する時に、その結果から1つのフィールド(属性)のみを使用したいという場合があります。 これは、以下のような構文で行うことができます。
SELECT (new_emp()).name; name ------ None
パーサが混乱しないように、括弧を追加する必要があります。 括弧なしで行おうとすると、以下のような結果になります。
SELECT new_emp().name; ERROR: syntax error at or near "." LINE 1: SELECT new_emp().name; ^
また、関数表記を使用して属性を抽出することもできます。
SELECT name(new_emp()); name ------ None
8.16.5で述べるように、フィールド表記と関数表記は等価です。
複合型を結果として返す関数を使用する他の方法は、その結果を、その行型を入力として受け付ける関数に渡す、以下のような方法です。
CREATE FUNCTION getname(emp) RETURNS text AS $$ SELECT $1.name; $$ LANGUAGE SQL; SELECT getname(new_emp()); getname --------- None (1 row)
関数の結果の記述方法には、他にも出力パラメータを使用して定義する方法があります。 以下に例を示します。
CREATE FUNCTION add_em (IN x int, IN y int, OUT sum int) AS 'SELECT x + y' LANGUAGE SQL; SELECT add_em(3,7); add_em -------- 10 (1 row)
37.5.2で示したadd_em
版と基本的な違いはありません。
複数列を返す関数を定義する簡単な方法を提供することが出力パラメータの本来の価値です。
以下に例を示します。
CREATE FUNCTION sum_n_product (x int, y int, OUT sum int, OUT product int) AS 'SELECT x + y, x * y' LANGUAGE SQL; SELECT * FROM sum_n_product(11,42); sum | product -----+--------- 53 | 462 (1 row)
これは基本的に、関数結果用の無名の複合型の作成を行います。 上の例では、
CREATE TYPE sum_prod AS (sum int, product int); CREATE FUNCTION sum_n_product (int, int) RETURNS sum_prod AS 'SELECT $1 + $2, $1 * $2' LANGUAGE SQL;
と同じ最終結果になります。 しかし、独立した複合型定義に悩まされることがなくなり、便利であるともいえます。 出力パラメータに割り振られた名前が単なる飾りではなく、無名複合型の列名を決定するものであることに注意してください。 (出力パラメータの名前を省略した場合、システム自身が名前を選びます。)
SQLからこうした関数を呼び出す時、出力パラメータが呼び出し側の引数リストに含まれないことに注意してください。 PostgreSQLでは入力パラメータのみが関数の呼び出しシグネチャを定義するとみなしているためです。 これはまた、関数を削除することなどを目的に関数を参照する場合、入力パラメータのみが考慮されることを意味しています。 上の関数は、次のいずれかの方法で削除することができます。
DROP FUNCTION sum_n_product (x int, y int, OUT sum int, OUT product int); DROP FUNCTION sum_n_product (int, int);
パラメータには、IN
(デフォルト)、OUT
、INOUT
、またはVARIADIC
という印を付与できます。
INOUT
パラメータは、入力パラメータ(呼び出し引数リストの一部)と出力パラメータ(結果のレコード型の一部)の両方を提供します。
VARIADIC
パラメータは入力パラメータですが、次に説明するように特別に扱われます。
すべての「オプションの」引数が同じデータ型の場合、SQL関数は可変長の引数を受け付けるように宣言できます。
オプションの引数は配列として関数に渡されます。
この関数は最後のパラメータをVARIADIC
と印を付けて宣言されます。
このパラメータは配列型であるとして宣言されなければなりません。
例をあげます。
CREATE FUNCTION mleast(VARIADIC arr numeric[]) RETURNS numeric AS $$ SELECT min($1[i]) FROM generate_subscripts($1, 1) g(i); $$ LANGUAGE SQL; SELECT mleast(10, -1, 5, 4.4); mleast -------- -1 (1 row)
実際、VARIADIC
の位置以降の実引数はすべて、あたかも以下のように記述したかのように、1次元の配列としてまとめられます。
SELECT mleast(ARRAY[10, -1, 5, 4.4]); -- 動作しません
しかし、実際にこのように記述することはできません。
少なくとも、この関数定義に一致しません。
VARIADIC
印の付いたパラメータは、自身の型ではなく、その要素型が1つ以上存在することに一致します。
時として、variadic関数に既に構築された配列を渡せることは有用です。
1つのvariadic関数が、自身の配列パラメータを他のものに渡したいとき特に便利です。
また、これが、信用できないユーザがオブジェクトを作成できるスキーマにあるvariadic関数を呼び出す唯一の安全な方法です。10.3を参照してください。
これは、呼び出しにVARIADIC
を指定することで行えます。
SELECT mleast(VARIADIC ARRAY[10, -1, 5, 4.4]);
これは関数のvariadicパラメータがその要素型に拡張するのを防ぎます。
その結果、配列引数値が標準的にマッチされるようになります。
VARIADIC
は関数呼び出しの最後の実引数としてのみ付加できます。
呼び出しでVARIADIC
を指定することは、variadic関数に空の配列を渡す唯一の方法でもあります。例えば、
SELECT mleast(VARIADIC ARRAY[]::numeric[]);
variadicパラメータが少なくとも1つの実引数と一致しなければなりませんので、単にSELECT mleast()
と書くだけでは上手くいきません。
(もしそのような呼び出しを許可したいのなら、mleast
という名前のパラメータのない第2の関数を定義することもできます。)
variadicパラメータから生成される配列要素パラメータは、それ自身にはまったく名前を持たないものとして扱われます。
これは、名前付き引数(4.3)を使用して可変長の関数を呼び出すことができないことを意味します。
ただし、VARIADIC
を指定する場合は例外です。
たとえば、
SELECT mleast(VARIADIC arr => ARRAY[10, -1, 5, 4.4]);
は動作しますが、
SELECT mleast(arr => 10); SELECT mleast(arr => ARRAY[10, -1, 5, 4.4]);
は動作しません。
一部またはすべての入力引数にデフォルト値を持つ関数を宣言することができます。 デフォルト値は、関数が実際の引数の数に足りない数の引数で呼び出された場合に挿入されます。 引数は実引数リストの終端から省略することができますので、デフォルト値を持つパラメータの後にあるパラメータはすべて、同様にデフォルト値を持たなければなりません。 (名前付きの引数記法を使用してこの制限を緩和させることもできますが、まだ位置引数記法が実用的に動作できることが強制されています。) 使うかどうかに関わりなく、この能力は、あるユーザが他のユーザを信用しないデータベースで関数を呼び出す時に、セキュリティの事前の対策を必要とします。10.3を参照してください。
以下に例を示します。
CREATE FUNCTION foo(a int, b int DEFAULT 2, c int DEFAULT 3) RETURNS int LANGUAGE SQL AS $$ SELECT $1 + $2 + $3; $$; SELECT foo(10, 20, 30); foo ----- 60 (1 row) SELECT foo(10, 20); foo ----- 33 (1 row) SELECT foo(10); foo ----- 15 (1 row) SELECT foo(); -- 最初の引数にデフォルトがないため失敗 ERROR: function foo() does not exist
=
記号をDEFAULT
キーワードの代わりに使用することもできます。
すべてのSQL関数は問い合わせのFROM
句で使用できますが、複合型を返す関数に特に便利です。
関数が基本型を返すよう定義されている場合、テーブル関数は1列からなるテーブルを作成します。
関数が複合型を返すよう定義されている場合、テーブル関数は複合型の列のそれぞれに対して1つの列を作成します。
以下に例を示します。
CREATE TABLE foo (fooid int, foosubid int, fooname text); INSERT INTO foo VALUES (1, 1, 'Joe'); INSERT INTO foo VALUES (1, 2, 'Ed'); INSERT INTO foo VALUES (2, 1, 'Mary'); CREATE FUNCTION getfoo(int) RETURNS foo AS $$ SELECT * FROM foo WHERE fooid = $1; $$ LANGUAGE SQL; SELECT *, upper(fooname) FROM getfoo(1) AS t1; fooid | foosubid | fooname | upper -------+----------+---------+------- 1 | 1 | Joe | JOE (1 row)
例からわかる通り、関数の結果の列を通常のテーブルの列と同じように扱うことができます。
この関数の結果得られたのは1行のみであることに注意してください。
これはSETOF
を指定しなかったためです。
これについては次節で説明します。
SQL関数がSETOF
sometype
を返すよう宣言されている場合、関数の最後の問い合わせは最後まで実行され、各出力行は結果集合の要素として返されます。
この機能は通常、関数をFROM
句内で呼び出す時に使用されます。
この場合、関数によって返される各行は、問い合わせによって見えるテーブルの行になります。
例えば、テーブルfoo
の内容が上記と同じであれば以下のようになります。
CREATE FUNCTION getfoo(int) RETURNS SETOF foo AS $$ SELECT * FROM foo WHERE fooid = $1; $$ LANGUAGE SQL; SELECT * FROM getfoo(1) AS t1;
この出力は以下の通りです。
fooid | foosubid | fooname -------+----------+--------- 1 | 1 | Joe 1 | 2 | Ed (2 rows)
また、以下のように出力パラメータで定義された列を持つ複数の行を返すことも可能です。
CREATE TABLE tab (y int, z int); INSERT INTO tab VALUES (1, 2), (3, 4), (5, 6), (7, 8); CREATE FUNCTION sum_n_product_with_tab (x int, OUT sum int, OUT product int) RETURNS SETOF record AS $$ SELECT $1 + tab.y, $1 * tab.y FROM tab; $$ LANGUAGE SQL; SELECT * FROM sum_n_product_with_tab(10); sum | product -----+--------- 11 | 10 13 | 30 15 | 50 17 | 70 (4 rows)
ここで重要な点は、関数が1行だけではなく複数行を返すことを示すためにRETURNS SETOF record
を記述しなければならない点です。
出力パラメータが1つしか存在しない場合は、record
ではなく、そのパラメータの型を記述してください。
集合を返す関数を、それぞれの呼び出し時に連続するテーブル行または副問い合わせに由来するパラメータを付けて、複数回呼び出すことで問い合わせ結果を構築することはしばしば有用です。
お勧めする方法は、7.2.1.5で説明するLATERAL
キーワードを使用することです。
以下は集合を返す関数を使用して、ツリー構造の要素を模擬する例です。
SELECT * FROM nodes; name | parent -----------+-------- Top | Child1 | Top Child2 | Top Child3 | Top SubChild1 | Child1 SubChild2 | Child1 (6 rows) CREATE FUNCTION listchildren(text) RETURNS SETOF text AS $$ SELECT name FROM nodes WHERE parent = $1 $$ LANGUAGE SQL STABLE; SELECT * FROM listchildren('Top'); listchildren -------------- Child1 Child2 Child3 (3 rows) SELECT name, child FROM nodes, LATERAL listchildren(name) AS child; name | child --------+----------- Top | Child1 Top | Child2 Top | Child3 Child1 | SubChild1 Child1 | SubChild2 (5 rows)
この例は単純な結合でできない何かを行うものではありません。 しかしより複雑な計算では、何らかの作業を関数内に押し込むオプションはかなり便利です。
集合を返す関数は問い合わせの選択リスト内でも呼び出すことができます。 問い合わせ自身によって生成する各行に対し、集合を返す関数が呼び出され、関数の結果集合の各要素に対して出力行が生成されます。 上の例は以下のような問い合わせでも実現することができます。
SELECT listchildren('Top'); listchildren -------------- Child1 Child2 Child3 (3 rows) SELECT name, listchildren(name) FROM nodes; name | listchildren --------+-------------- Top | Child1 Top | Child2 Top | Child3 Child1 | SubChild1 Child1 | SubChild2 (5 rows)
最後のSELECT
において、Child2
とChild3
などが出力行に表示されていないことに注意してください。
これは、listchildren
がこの入力に対して空の集合を返すため出力行が生成されないからです。
LATERAL
構文を使用した時の関数の結果との内部結合から得る場合と同じ動作です。
選択リストにある集合を返す関数に対するPostgreSQLの振舞いは、集合を返す関数がLATERAL FROM
句に書かれている場合とほとんど同じです。
例えば
SELECT x, generate_series(1,5) AS g FROM tab;
は
SELECT x, g FROM tab, LATERAL generate_series(1,5) AS g;
とほぼ同じです。
この特定の例では、g
は実際にはtab
にLATERALには依存しませんので、プランナがネステッドループ結合の外にg
を置くことを選ぶかもしれないという点を除いて、全く同じです。
そのため、出力行の順番が異なる結果になるかもしれません。
選択リスト内の集合を返す関数は、FROM
句からの次の行が考慮される前に関数の実行が完了するよう、FROM
句の残りとのネステッドループ結合の中にあるかのように必ず評価されます。
問い合わせの選択リスト内に集合を返す関数が2つ以上ある場合には、振舞いは一つのLATERAL ROWS FROM( ... )
FROM
句に関数を置いた場合に得られるものと似ています。
元となる問い合わせからの各行に対して、各関数からの最初の結果を使った出力行、2番目の結果を使った出力行、と続きます。
集合を返す関数の中に他のものより出力の数が少ないものがある場合には、欠けたデータの代わりにNULL値が使われますので、1つの元となる行から作られる行の合計の数は、一番多くの出力を出力する集合を返す関数に対するのと同じだけになります。
そのため、集合を返す関数はすべてが尽きるまで「歩調を合わせて」実行され、それから次の元となる行へと実行が続きます。
集合を返す関数は、FROM
句内では許されていませんが、選択リスト内では入れ子にできます。
その場合、入れ子の各階層は、別々のLATERAL ROWS FROM( ... )
であるかのように別々に扱われます。
例えば、
SELECT srf1(srf2(x), srf3(y)), srf4(srf5(z)) FROM tab;
では、集合を返す関数srf2
、srf3
、srf5
はtab
の各行に対して歩調を合わせて実行され、次に階層の低い関数が生成した各行に対してsrf1
とsrf4
が歩調を合わせて適用されます。
集合を返す関数はCASE
やCOALESCE
のような条件を評価する構成の中では使えません。
例えば、
SELECT x, CASE WHEN x > 0 THEN generate_series(1, 5) ELSE 0 END FROM tab;
を考えてください。
これは、x > 0
である入力行の5回の繰り返しとそうでないものの1回の繰り返しを生成するように思えるかもしれません。しかし、実際には、generate_series(1, 5)
はCASE
が評価される前に暗黙のLATERAL FROM
の中で実行されますので、各入力行に対して5回の繰り返しを生成します。
混乱を減らすため、そのような場合にはその代わりに解析時エラーになります。
もし関数の最後のコマンドがRETURNING
を持つINSERT
、UPDATE
、またはDELETE
である場合、関数がSETOF
付きで宣言されていない、または呼び出す問い合わせがすべての結果行を取り出さなくても、そのコマンドは完了まで実行されます。
RETURNING
句で生成される余計な行はすべて警告無しに削除されますが、コマンド対象のテーブルの変更はそれでも起こります(そして、関数から戻る前にすべて完了します)。
PostgreSQL 10より前では、集合を返す関数を2つ以上同じ選択リストに置くと常に等しい数の行を生成しない限りあまり賢くは振舞いませんでした。
そうでなければ、得られるのは、集合を返す関数が生成する行の数の最小公倍数に等しい数の出力行でした。
また、入れ子の集合を返す関数は上に書いたようには動作しませんでした。代わりに、集合を返す関数は多くても1つの集合を返す引数を持ち、集合を返す関数の各入れ子は独立に実行されました。
また、条件実行(CASE
等の内側にある集合を返す関数)は以前は認められており、事態をより複雑にしていました。
PostgreSQLの古いバージョンで動作することが必要な問い合わせを書く場合には、バージョンが異なっても一貫した結果を返しますので、LATERAL
構文を使うことを勧めます。
集合を返す関数の条件実行に頼った問い合わせがあるのなら、条件確認を独自の集合を返す関数の中に移動することで修正できます。
例えば
SELECT x, CASE WHEN y > 0 THEN generate_series(1, z) ELSE 5 END FROM tab;
は
CREATE FUNCTION case_generate_series(cond bool, start int, fin int, els int) RETURNS SETOF int AS $$ BEGIN IF cond THEN RETURN QUERY SELECT generate_series(start, fin); ELSE RETURN QUERY SELECT els; END IF; END$$ LANGUAGE plpgsql; SELECT x, case_generate_series(y > 0, 1, z, 5) FROM tab;
になります。 この定式化はPostgreSQLのバージョンすべてで同じように動作します。
TABLE
を返すSQL関数
集合を返すものとして関数を宣言するには、他にも方法があります。
RETURNS TABLE(
構文を使用することです。
これは1つ以上のcolumns
)OUT
パラメータを使い、さらに、関数をSETOF record
(または、適切ならば単一の出力パラメータの型のSETOF
)を返すものと印を付けることと等価です。
この記法は標準SQLの最近の版で規定されたものですので、SETOF
を使用するより移植性がより高いかもしれません。
例えば前述の合計と積の例はこのように書けます。
CREATE FUNCTION sum_n_product_with_tab (x int) RETURNS TABLE(sum int, product int) AS $$ SELECT $1 + tab.y, $1 * tab.y FROM tab; $$ LANGUAGE SQL;
RETURNS TABLE
記法と一緒に、明示的OUT
またはINOUT
パラメータを使用することはできません。
すべての出力列をTABLE
リストに含めなければなりません。
SQL関数は、37.2.5の多様型を受け付け、返すように宣言することができます。
以下のmake_array
多様関数は、任意の2つのデータ型要素から配列を作成します。
CREATE FUNCTION make_array(anyelement, anyelement) RETURNS anyarray AS $$ SELECT ARRAY[$1, $2]; $$ LANGUAGE SQL; SELECT make_array(1, 2) AS intarray, make_array('a'::text, 'b') AS textarray; intarray | textarray ----------+----------- {1,2} | {a,b} (1 row)
'a'::text
という型キャストを使用して、引数がtext
型であることを指定していることに注目してください。
これは引数が単なる文字列リテラルである場合に必要です。
さもないと、unknown
型として扱われてしまうため、無効なunknown
の配列を返そうとしてしまいます。
型キャストがないと、以下のようなエラーが発生します。
ERROR: could not determine polymorphic type because input has type unknown
上記のようにmake_array
を宣言した場合、まったく同じデータ型の2つの引数を指定する必要があります。
システムは型の違いを解決しようとしません。
したがって、例えばこれはうまくいきません。
SELECT make_array(1, 2.5) AS numericarray; ERROR: function make_array(integer, numeric) does not exist
別の方法として、「共通」族の多様型を使用する方法があります。 これにより、システムは適切な共通の型を特定できます。
CREATE FUNCTION make_array2(anycompatible, anycompatible) RETURNS anycompatiblearray AS $$ SELECT ARRAY[$1, $2]; $$ LANGUAGE SQL; SELECT make_array2(1, 2.5) AS numericarray; numericarray -------------- {1,2.5} (1 row)
すべての入力が未知の型である場合、共通の型を解決するルールはデフォルトでtext
型を選択するので、これも動作します。
SELECT make_array2('a', 'b') AS textarray; textarray ----------- {a,b} (1 row)
固定の戻り値型を持ちながら多様引数を持つことは許されますが、逆は許されません。 以下に例を示します。
CREATE FUNCTION is_greater(anyelement, anyelement) RETURNS boolean AS $$ SELECT $1 > $2; $$ LANGUAGE SQL; SELECT is_greater(1, 2); is_greater ------------ f (1 row) CREATE FUNCTION invalid_func() RETURNS anyelement AS $$ SELECT 1; $$ LANGUAGE SQL; ERROR: cannot determine result data type DETAIL: A result of type anyelement requires at least one input of type anyelement, anyarray, anynonarray, anyenum, or anyrange.
出力引数を持つ関数でも多様性を使用することができます。 以下に例を示します。
CREATE FUNCTION dup (f1 anyelement, OUT f2 anyelement, OUT f3 anyarray) AS 'select $1, array[$1,$1]' LANGUAGE SQL; SELECT * FROM dup(22); f2 | f3 ----+--------- 22 | {22,22} (1 row)
多様性はvariadic関数とともに使用できます。例をあげます。
CREATE FUNCTION anyleast (VARIADIC anyarray) RETURNS anyelement AS $$ SELECT min($1[i]) FROM generate_subscripts($1, 1) g(i); $$ LANGUAGE SQL; SELECT anyleast(10, -1, 5, 4); anyleast ---------- -1 (1 row) SELECT anyleast('abc'::text, 'def'); anyleast ---------- abc (1 row) CREATE FUNCTION concat_values(text, VARIADIC anyarray) RETURNS text AS $$ SELECT array_to_string($2, $1); $$ LANGUAGE SQL; SELECT concat_values('|', 1, 4, 2); concat_values --------------- 1|4|2 (1 row)
SQL関数が照合順序の変更が可能なデータ型のパラメータを1つ以上持つ場合、23.2で説明されているように、それぞれの関数呼び出しに対して、実引数に割り当てられた照合順序に応じて、照合順序が識別されます。
照合順序の識別に成功した(つまり、暗黙的な照合順序がすべての引数で競合しない)場合、すべての照合順序の変更が可能なパラメータは暗黙的に照合順序を持つものとして扱われます。
これは関数内の照合順序に依存する操作の振舞いに影響します。
例えば、上記のanyleast
を使って考えます。
SELECT anyleast('abc'::text, 'ABC');
この結果はデータベースのデフォルト照合順序に依存します。
C
ロケールではABC
という結果になりますが、他の多くのロケールではabc
になります。
使用される照合順序をCOLLATE
句を付与することで強制することができます。
例を以下に示します。
SELECT anyleast('abc'::text, 'ABC' COLLATE "C");
この他、呼び出し元の照合順序とは関係なく特定の照合順序で動作する関数にしたければ、関数定義において必要な所にCOLLATE
句を付けてください。
以下のanyleast
では、文字列を比較する際に常にen_US
を使用します。
CREATE FUNCTION anyleast (VARIADIC anyarray) RETURNS anyelement AS $$ SELECT min($1[i] COLLATE "en_US") FROM generate_subscripts($1, 1) g(i); $$ LANGUAGE SQL;
しかし、もし照合順序の変更ができないデータ型が与えられた場合にエラーになってしまうことに注意してください。
実引数全体で共通の照合順序を識別できない場合、SQL関数はパラメータがそのデータ型のデフォルト照合順序(通常はデータベースのデフォルトの照合順序ですが、ドメイン型のパラメータでは異なる可能性があります)を持つものとみなします。
照合順序の変更ができるパラメータの動作は、テキストのデータ型にのみ適用できる、限定された多様性と考えることができます。