本節では文字列の値の調査や操作のための関数と演算子について説明します。
ここでの文字列とはcharacter
データ型、character varying
データ型、およびtext
データ型の値を含みます。
補足説明のない限り、下記に挙げている全ての関数はこれら全てのデータ型に対して使用できますが、character
データ型を使用した場合、自動的に空白文字が詰め込まれるという潜在的作用がありますので注意してください。
ビット文字列データ型に対する専用の関数もいくつかあります。
SQLでは引数の区切りにカンマではなくキーワードを使用する文字列関数をいくつか定義しています。 詳細については表 9.9を参照してください。 またPostgreSQLは、これらの関数に対して通常の関数呼び出し構文を使用するバージョンを提供します(表 9.10を参照してください)。
PostgreSQLの8.3より前において、これらの関数はいくつかの非文字列データ型の値を警告なしに受け付けたのは、それらデータ型を暗黙的にtext
型に型変換していたことによります。
この強制的な変換は、頻繁に予期しない動作の原因となったので削除されました。
しかし、文字列連結演算子(||
)は表 9.9で示されるように、少なくともひとつの入力が文字列型であれば、依然として非文字列入力を受け付けます。
その他の場合、以前と同じ動作が必要なら、text
への明示的な変換を行ってください。
表9.9 SQL文字列関数と演算子
関数 | 戻り値型 | 説明 | 例 | 結果 |
---|---|---|---|---|
| text | 文字列結合 | 'Post' || 'greSQL' | PostgreSQL |
または、
| text | ひとつの非文字列の入力がある文字列結合 | 'Value: ' || 42 | Value: 42 |
| int | 文字列中のビット数 | bit_length('jose') | 32 |
または
| int | 文字列中の文字数 | char_length('jose') | 4 |
| text | 文字列を小文字に変換 | lower('TOM') | tom |
| int | 文字列中のバイト数 | octet_length('jose') | 4 |
| text | 部分文字列の置換 | overlay('Txxxxas' placing 'hom' from 2 for 4) | Thomas |
| int | 指定した部分文字列の場所 | position('om' in 'Thomas') | 3 |
| text | 部分文字列の取り出し | substring('Thomas' from 2 for 3) | hom |
| text | POSIX正規表現に一致する部分文字列を取り出します。 パターンマッチに関してより詳細は、9.7を参照してください。 | substring('Thomas' from '...$') | mas |
| text | SQL正規表現に一致する部分文字列を取り出します。 パターンマッチに関してより詳細は、9.7を参照してください。 | substring('Thomas' from '%#"o_a#"_' for '#') | oma |
| text |
characters (デフォルトでは空白)に含まれる文字のみを含む最も長い文字列を、string の先頭(start)、末尾(end)、あるいはその両方(both、デフォルトはboth です)から削除します。
| trim(both 'xyz' from 'yxTomxx') | Tom |
| text |
trim() の標準と異なる構文
| trim(both from 'yxTomxx', 'xyz') | Tom |
| text | 文字列を大文字に変換 | upper('tom') | TOM |
この他、表 9.10に列挙する文字列操作関数が使えます。 そのいくつかは、表 9.9で列挙した標準SQLの文字列関数を実装するため、内部的に使用されます。
表9.10 その他の文字列関数
関数 | 戻り値型 | 説明 | 例 | 結果 |
---|---|---|---|---|
| int | 引数の最初の文字のASCIIコード。 UTF8に対しては文字のUnicodeコードポイントを返します。 その他のマルチバイト符号化方式の場合、引数はASCII文字でなくてはなりません。 | ascii('x') | 120 |
| text |
characters (デフォルトは空白文字)で指定された文字のみを有する最長の文字列を、string の先頭と末尾から削除します。
| btrim('xyxtrimyyx', 'xyz') | trim |
| text | 与えられたコードの文字。UTF8では引数はUnicodeコードポイントとして扱われます。 その他のマルチバイト符号化方式で引数はASCII文字を指定するものである必要があります。 NULL (0)文字はテキストデータ型がそのようなバイトを格納することができないので許可されません。 | chr(65) | A |
| text | すべての引数のテキスト表現を結合します。NULLの引数は無視されます。 | concat('abcde', 2, NULL, 22) | abcde222 |
| text | 第一引数を除くすべての引数を、区切り文字を付けて結合します。 第一引数は区切り文字列として使用されます。 NULLの引数は無視されます。 | concat_ws(',', 'abcde', 2, NULL, 22) | abcde,2,22 |
| bytea |
文字列をdest_encoding に変換します。
元の符号化方式はsrc_encoding で指定されます。
string はこの符号化方式で有効でなければなりません。
変換はCREATE CONVERSION で定義されます。
また、あらかじめ定義された変換もあります。
利用可能な変換については表 9.11を参照してください。
| convert('text_in_utf8', 'UTF8', 'LATIN1') | Latin-1(ISO 8859-1)符号化方式のtext_in_utf8 |
| text |
データベースの符号化方式に文字列を変換します。
元の符号化方式はsrc_encoding で指定されます。
string はこの符号化方式で有効なものでなければなりません。
| convert_from('text_in_utf8', 'UTF8') | 現在のデータベース符号化方式のtext_in_utf8 |
| bytea |
文字列をdest_encoding に変換します。
| convert_to('some text', 'UTF8') | UTF8符号化方式のsome text |
| bytea |
string のテキスト表現からバイナリデータを復号します。
format のオプションはencode() と同じです。
| decode('MTIzAAE=', 'base64') | \x3132330001 |
| text |
バイナリデータをテキスト表現形式に符号化します。
サポートされているformatは、base64 、hex 、escape です。
escape は0のバイトと最上位ビットがセットされているバイトを8進数のシーケンス(\ nnn )に変換し 、バックスラッシュを二重化します。
| encode('123\000\001', 'base64') | MTIzAAE= |
| text |
引数の書式をフォーマット文字列に従って整えます。
この関数はC言語関数のsprintf と似ています。
9.4.1を参照してください。
| format('Hello %s, %1$s', 'World') | Hello World, World |
| text | それぞれの単語の第一文字を大文字に、残りは小文字に変換します。 ここで単語とは、英数字以外の文字で区切られた、英数字からなる文字の並びのことです。 | initcap('hi THOMAS') | Hi Thomas |
| text |
文字列の先頭からn 文字を返します。
n が負数の場合、文字列の末尾から|n |文字を切り取った文字列を返します。
| left('abcde', 2) | ab |
| int |
string 内の文字数
| length('jose') | 4 |
| int |
与えられたencoding でのstring 内の文字数。
string はこの符号化方式で有効でなければなりません。
| length('jose', 'UTF8') | 4 |
| text |
文字fill (デフォルトは空白文字)を文字列の前に追加して、string をlength の長さにします。
string が既にlength の長さを超えている場合は(右側が)切り捨てられます。
| lpad('hi', 5, 'xy') | xyxhi |
| text |
string の最初から、characters (デフォルトはスペース)で指定された文字だけを有する最長の文字列を削除します。
| ltrim('zzzytest', 'xyz') | test |
| text |
string のMD5ハッシュを計算し、16進数で結果を返します。
| md5('abc') | 900150983cd24fb0 d6963f7d28e17f72 |
| text[] |
qualified_identifier を識別子の配列に分割し、個々の識別子に引用符があればそれを削除します。
デフォルトでは、最後の識別子の後に続く余分な文字はエラーとされますが、2番目のパラメータがfalse の場合は、そのような余分な文字は無視されます。
(この動作は、関数のようなオブジェクトに対して名前を解析するときに便利でしょう。)
この関数は、長すぎる識別子を切り詰めないことに注意してください。
切り詰めが必要なときは、その結果をname[] にキャストすることができます。
| parse_ident('"SomeSchema".someTable') | {SomeSchema,sometable} |
| name | 現在のクライアントの符号化方式の名前。 | pg_client_encoding() | SQL_ASCII |
| text | 与えられた文字列を、SQL問い合わせ文字列で識別子として使用できるように、適切な引用符を付けて返します。 引用符は、必要な場合(すなわち、文字列に識別子として使用できない文字が含まれる場合や、大文字変換される場合)にのみ追加されます。埋め込まれた引用符は、適切に二重化されます。 例 42.1も参照してください。 | quote_ident('Foo bar') | "Foo bar" |
| text |
与えられた文字列を、SQL問い合わせ文字列で文字リテラルとして使用できるように、適切な引用符を付けて返します。
埋め込まれた単一引用符およびバックスラッシュは、適切に二重化されます。
quote_literal はNULL入力に対してNULLを返すことに注意してください。引数がNULLとなる可能性がある場合、よりquote_nullable の方がしばしば適しています。
例 42.1も参照してください。
| quote_literal(E'O\'Reilly') | 'O''Reilly' |
| text | 与えられた値をテキストに変換し、そしてリテラルとして引用符付けします。 埋め込まれた単一引用符とバックスラッシュは適切に二重化されます。 | quote_literal(42.5) | '42.5' |
| text |
与えられた文字列を、SQL問い合わせ文字列で文字列リテラルとして使用できるように、適切な引用符を付けて返します。
また、引数がNULLの場合、NULL を返します。
埋め込まれた単一引用符およびバックスラッシュは適切に二重化されます。
例 42.1も参照してください。
| quote_nullable(NULL) | NULL |
| text |
与えられた値をテキストに変換し、そしてリテラルとして引用符付けします。引数がNULLの場合はNULL を返します。
埋め込まれた単一引用符とバックスラッシュは適切に二重化されます。
| quote_nullable(42.5) | '42.5' |
| text[] |
string に対してPOSIX正規表現でマッチし、捕捉された最初の部分文字列を返します。
より詳細は9.7.3を参照してください。
| regexp_match('foobarbequebaz', '(bar)(beque)') | {bar,beque} |
| setof text[] |
string に対してPOSIX正規表現でマッチし、捕捉された部分文字列を返します。
より詳細は9.7.3を参照してください。
| regexp_matches('foobarbequebaz', 'ba.', 'g') | {bar}
|
| text | POSIX正規表現に一致する部分文字列を置換します。 より詳細は9.7.3を参照してください。 | regexp_replace('Thomas', '.[mN]a.', 'M') | ThM |
| text[] |
POSIX正規表現を区切り文字に使ってstring を分割します。
詳しくは9.7.3を参照ください。
| regexp_split_to_array('hello world', '\s+') | {hello,world} |
| setof text |
POSIX正規表現を区切り文字に使ってstring を分割します。
詳しくは9.7.3を参照ください。
| regexp_split_to_table('hello world', '\s+') | hello
|
| text | 指定されたnumber の数だけstring を繰り返します。 | repeat('Pg', 4) | PgPgPgPg |
| text | string に出現する全てのfrom 部分文字列をto 部分文字列に置換します。
| replace('abcdefabcdef', 'cd', 'XX') | abXXefabXXef |
| text | 逆順にした文字列を返します。 | reverse('abcde') | edcba |
| text |
文字列の末尾からn 文字を返します。
n が負数の場合は、文字列の先頭から|n |文字だけ切り取った文字列を返します。
| right('abcde', 2) | de |
| text |
文字fill (デフォルトはスペース)を文字列に追加して、string をlength の長さにします。
string が既にlength の長さを超えている場合は切り捨てられます。
| rpad('hi', 5, 'xy') | hixyx |
| text |
string の末尾から、characters (デフォルトはスペース)で指定された文字のみを有する最長の文字列を削除します。
| rtrim('testxxzx', 'xyz') | test |
| text | string をdelimiter で分割し、その結果から(1から始まるように数える)指定したフィールドを返します。
| split_part('abc~@~def~@~ghi', '~@~', 2) | def |
| int |
指定した部分文字列の位置を特定します(position( と同じですが、引数の順序が逆になっていることに注意してください)。
| strpos('high', 'ig') | 2 |
| text |
指定した部分文字列を取り出します(substring( と同じです)。
| substr('alphabet', 3, 2) | ph |
| bool |
string がprefix で始まっていれば真を返します。
| starts_with('alphabet', 'alph') | t |
| text |
string を他の符号化方式からASCIIに変換します(LATIN1 、LATIN2 、LATIN9 、WIN1250 符号化方式からの変換のみをサポートします。)
| to_ascii('Karel') | Karel |
| text | number を、同等の16進数表現に変換します。
| to_hex(2147483647) | 7fffffff |
| text |
from 集合内の文字と一致するstring にある全ての文字は、to 集合内のそれに対応する文字に置き換えられます。
もしfrom がto より長い場合、from で指定される余分な文字に一致するものは削除されます。
| translate('12345', '143', 'ax') | a2x5 |
concat
、concat_ws
およびformat
関数はVariadicです。従って、キーワードVARIADIC
で標しをつけられた配列のように、値を連結またはフォーマットした形で受け渡すことが可能です(37.5.5を参照してください)。
配列の要素は関数に対して分割された通常の引数のように扱われます。
もしvariadic配列引数がNULLであれば、concat
およびconcat_ws
はNULLを返しますが、format
はNULLを要素を持たない配列と扱います。
9.20内のstring_agg
集約関数も参照してください。
表9.11 組み込みの変換
変換名 [a] | 変換前の符号化方式 | 変換後の符号化方式 |
---|---|---|
ascii_to_mic | SQL_ASCII | MULE_INTERNAL |
ascii_to_utf8 | SQL_ASCII | UTF8 |
big5_to_euc_tw | BIG5 | EUC_TW |
big5_to_mic | BIG5 | MULE_INTERNAL |
big5_to_utf8 | BIG5 | UTF8 |
euc_cn_to_mic | EUC_CN | MULE_INTERNAL |
euc_cn_to_utf8 | EUC_CN | UTF8 |
euc_jp_to_mic | EUC_JP | MULE_INTERNAL |
euc_jp_to_sjis | EUC_JP | SJIS |
euc_jp_to_utf8 | EUC_JP | UTF8 |
euc_kr_to_mic | EUC_KR | MULE_INTERNAL |
euc_kr_to_utf8 | EUC_KR | UTF8 |
euc_tw_to_big5 | EUC_TW | BIG5 |
euc_tw_to_mic | EUC_TW | MULE_INTERNAL |
euc_tw_to_utf8 | EUC_TW | UTF8 |
gb18030_to_utf8 | GB18030 | UTF8 |
gbk_to_utf8 | GBK | UTF8 |
iso_8859_10_to_utf8 | LATIN6 | UTF8 |
iso_8859_13_to_utf8 | LATIN7 | UTF8 |
iso_8859_14_to_utf8 | LATIN8 | UTF8 |
iso_8859_15_to_utf8 | LATIN9 | UTF8 |
iso_8859_16_to_utf8 | LATIN10 | UTF8 |
iso_8859_1_to_mic | LATIN1 | MULE_INTERNAL |
iso_8859_1_to_utf8 | LATIN1 | UTF8 |
iso_8859_2_to_mic | LATIN2 | MULE_INTERNAL |
iso_8859_2_to_utf8 | LATIN2 | UTF8 |
iso_8859_2_to_windows_1250 | LATIN2 | WIN1250 |
iso_8859_3_to_mic | LATIN3 | MULE_INTERNAL |
iso_8859_3_to_utf8 | LATIN3 | UTF8 |
iso_8859_4_to_mic | LATIN4 | MULE_INTERNAL |
iso_8859_4_to_utf8 | LATIN4 | UTF8 |
iso_8859_5_to_koi8_r | ISO_8859_5 | KOI8R |
iso_8859_5_to_mic | ISO_8859_5 | MULE_INTERNAL |
iso_8859_5_to_utf8 | ISO_8859_5 | UTF8 |
iso_8859_5_to_windows_1251 | ISO_8859_5 | WIN1251 |
iso_8859_5_to_windows_866 | ISO_8859_5 | WIN866 |
iso_8859_6_to_utf8 | ISO_8859_6 | UTF8 |
iso_8859_7_to_utf8 | ISO_8859_7 | UTF8 |
iso_8859_8_to_utf8 | ISO_8859_8 | UTF8 |
iso_8859_9_to_utf8 | LATIN5 | UTF8 |
johab_to_utf8 | JOHAB | UTF8 |
koi8_r_to_iso_8859_5 | KOI8R | ISO_8859_5 |
koi8_r_to_mic | KOI8R | MULE_INTERNAL |
koi8_r_to_utf8 | KOI8R | UTF8 |
koi8_r_to_windows_1251 | KOI8R | WIN1251 |
koi8_r_to_windows_866 | KOI8R | WIN866 |
koi8_u_to_utf8 | KOI8U | UTF8 |
mic_to_ascii | MULE_INTERNAL | SQL_ASCII |
mic_to_big5 | MULE_INTERNAL | BIG5 |
mic_to_euc_cn | MULE_INTERNAL | EUC_CN |
mic_to_euc_jp | MULE_INTERNAL | EUC_JP |
mic_to_euc_kr | MULE_INTERNAL | EUC_KR |
mic_to_euc_tw | MULE_INTERNAL | EUC_TW |
mic_to_iso_8859_1 | MULE_INTERNAL | LATIN1 |
mic_to_iso_8859_2 | MULE_INTERNAL | LATIN2 |
mic_to_iso_8859_3 | MULE_INTERNAL | LATIN3 |
mic_to_iso_8859_4 | MULE_INTERNAL | LATIN4 |
mic_to_iso_8859_5 | MULE_INTERNAL | ISO_8859_5 |
mic_to_koi8_r | MULE_INTERNAL | KOI8R |
mic_to_sjis | MULE_INTERNAL | SJIS |
mic_to_windows_1250 | MULE_INTERNAL | WIN1250 |
mic_to_windows_1251 | MULE_INTERNAL | WIN1251 |
mic_to_windows_866 | MULE_INTERNAL | WIN866 |
sjis_to_euc_jp | SJIS | EUC_JP |
sjis_to_mic | SJIS | MULE_INTERNAL |
sjis_to_utf8 | SJIS | UTF8 |
windows_1258_to_utf8 | WIN1258 | UTF8 |
uhc_to_utf8 | UHC | UTF8 |
utf8_to_ascii | UTF8 | SQL_ASCII |
utf8_to_big5 | UTF8 | BIG5 |
utf8_to_euc_cn | UTF8 | EUC_CN |
utf8_to_euc_jp | UTF8 | EUC_JP |
utf8_to_euc_kr | UTF8 | EUC_KR |
utf8_to_euc_tw | UTF8 | EUC_TW |
utf8_to_gb18030 | UTF8 | GB18030 |
utf8_to_gbk | UTF8 | GBK |
utf8_to_iso_8859_1 | UTF8 | LATIN1 |
utf8_to_iso_8859_10 | UTF8 | LATIN6 |
utf8_to_iso_8859_13 | UTF8 | LATIN7 |
utf8_to_iso_8859_14 | UTF8 | LATIN8 |
utf8_to_iso_8859_15 | UTF8 | LATIN9 |
utf8_to_iso_8859_16 | UTF8 | LATIN10 |
utf8_to_iso_8859_2 | UTF8 | LATIN2 |
utf8_to_iso_8859_3 | UTF8 | LATIN3 |
utf8_to_iso_8859_4 | UTF8 | LATIN4 |
utf8_to_iso_8859_5 | UTF8 | ISO_8859_5 |
utf8_to_iso_8859_6 | UTF8 | ISO_8859_6 |
utf8_to_iso_8859_7 | UTF8 | ISO_8859_7 |
utf8_to_iso_8859_8 | UTF8 | ISO_8859_8 |
utf8_to_iso_8859_9 | UTF8 | LATIN5 |
utf8_to_johab | UTF8 | JOHAB |
utf8_to_koi8_r | UTF8 | KOI8R |
utf8_to_koi8_u | UTF8 | KOI8U |
utf8_to_sjis | UTF8 | SJIS |
utf8_to_windows_1258 | UTF8 | WIN1258 |
utf8_to_uhc | UTF8 | UHC |
utf8_to_windows_1250 | UTF8 | WIN1250 |
utf8_to_windows_1251 | UTF8 | WIN1251 |
utf8_to_windows_1252 | UTF8 | WIN1252 |
utf8_to_windows_1253 | UTF8 | WIN1253 |
utf8_to_windows_1254 | UTF8 | WIN1254 |
utf8_to_windows_1255 | UTF8 | WIN1255 |
utf8_to_windows_1256 | UTF8 | WIN1256 |
utf8_to_windows_1257 | UTF8 | WIN1257 |
utf8_to_windows_866 | UTF8 | WIN866 |
utf8_to_windows_874 | UTF8 | WIN874 |
windows_1250_to_iso_8859_2 | WIN1250 | LATIN2 |
windows_1250_to_mic | WIN1250 | MULE_INTERNAL |
windows_1250_to_utf8 | WIN1250 | UTF8 |
windows_1251_to_iso_8859_5 | WIN1251 | ISO_8859_5 |
windows_1251_to_koi8_r | WIN1251 | KOI8R |
windows_1251_to_mic | WIN1251 | MULE_INTERNAL |
windows_1251_to_utf8 | WIN1251 | UTF8 |
windows_1251_to_windows_866 | WIN1251 | WIN866 |
windows_1252_to_utf8 | WIN1252 | UTF8 |
windows_1256_to_utf8 | WIN1256 | UTF8 |
windows_866_to_iso_8859_5 | WIN866 | ISO_8859_5 |
windows_866_to_koi8_r | WIN866 | KOI8R |
windows_866_to_mic | WIN866 | MULE_INTERNAL |
windows_866_to_utf8 | WIN866 | UTF8 |
windows_866_to_windows_1251 | WIN866 | WIN |
windows_874_to_utf8 | WIN874 | UTF8 |
euc_jis_2004_to_utf8 | EUC_JIS_2004 | UTF8 |
utf8_to_euc_jis_2004 | UTF8 | EUC_JIS_2004 |
shift_jis_2004_to_utf8 | SHIFT_JIS_2004 | UTF8 |
utf8_to_shift_jis_2004 | UTF8 | SHIFT_JIS_2004 |
euc_jis_2004_to_shift_jis_2004 | EUC_JIS_2004 | SHIFT_JIS_2004 |
shift_jis_2004_to_euc_jis_2004 | SHIFT_JIS_2004 | EUC_JIS_2004 |
[a]
変換名は、標準命名体系に従っています。変換元符号化方式の公式名の内、英数字以外の文字をアンダースコアで置き換え、その後に |
format
関数format
は、C関数のsprintf
同様の形式で、フォーマット文字列に従ってフォーマットされた出力を生成します。
format
(formatstr
text
[,formatarg
"any"
[, ...] ])
formatstr
は結果がどのようにフォーマットされるかを指定するフォーマット文字列です。
フォーマット指示子が使用されている箇所を除き、フォーマット文字列のテキストは結果に直接コピーされます。
フォーマット指示子は文字列中のプレースホルダとして振舞い、その後に引き続く関数引数がどのようにフォーマットされ、どのように結果に挿入されるかを定義します。
それぞれのformatarg
引数はそのデータ型に対する通常の出力規定に従ってテキストに変換され、その後フォーマット指示子に従って、結果文字列に挿入されます。
フォーマット指示子は%
文字で始まり、以下の形式をとります。
%[position
][flags
][width
]type
ここで要素フィールドとは以下になっています。
position
(省略可能)
形式
の文字列で、n
$n
は出力する引数のインデックスです。
インデックス1はformatstr
の後の最初の引数です。
position
が省略されると、一連の中の次の引数がデフォルトとして使用されます。
flags
(省略可能)
フォーマット指示子の出力がどのようにフォーマットされるかを制御する追加の任意の要素です。
現在、サポートされているflagはマイナス記号(-
)のみで、フォーマット指示子の出力が左詰めになるようにします。
これはwidth
フィールドが同時に指定されていない場合効果はありません。
width
(省略可能)
フォーマット指示子の出力を表示する最小文字数を指定します。
出力は、幅を満たすのに必要な空白が左または右(flagの-
による)に埋め込まれます。
幅が小さすぎても出力が切り詰められることはなく、単に無視されます。
幅は次のいずれかでも指定できます。それらは、正の整数、幅としての次の関数引数として使用する星印 (*
)、またはn
番目の関数引数を幅として使用する*
という形式の文字列です。
n
$
幅を関数引数から取得する場合、その引数はフォーマット指示子の値に使用される引数より先に消費されます。
幅の引数が負の場合、フィールド長abs
(width
)の範囲内で結果は(あたかもflagで-
が指定されたように)左詰めになります。
type
(必須)フォーマット指示子の出力を生成するのに使用されるフォーマット変換の型。 以下の型がサポートされています。
s
は引数の値を単純文字列にフォーマットします。
NULL値は空文字列として扱われます。
I
は、引数をSQLの識別子として取り扱い、必要ならそれを二重引用符で括ります。
NULL値はエラーです(quote_ident
と同等です)。
L
は引数値をSQLリテラルとして引用符が付けられます。
NULL値は引用符無しの文字列NULL
となります(quote_nullable
と同等です)。
上記で説明したフォーマット指示子に加え、特別の並びの%%
がリテラル%
文字を出力するために使用することもできます。
基本的なフォーマット変換の例を幾つか下記に紹介します。
SELECT format('Hello %s', 'World'); Result:Hello World
SELECT format('Testing %s, %s, %s, %%', 'one', 'two', 'three'); Result:Testing one, two, three, %
SELECT format('INSERT INTO %I VALUES(%L)', 'Foo bar', E'O\'Reilly'); Result:INSERT INTO "Foo bar" VALUES('O''Reilly')
SELECT format('INSERT INTO %I VALUES(%L)', 'locations', 'C:\Program Files'); Result:INSERT INTO locations VALUES('C:\Program Files')
width
フィールドとflagの-
を使用した例を以下に示します。
SELECT format('|%10s|', 'foo'); Result:| foo|
SELECT format('|%-10s|', 'foo'); Result:|foo |
SELECT format('|%*s|', 10, 'foo'); Result:| foo|
SELECT format('|%*s|', -10, 'foo'); Result:|foo |
SELECT format('|%-*s|', 10, 'foo'); Result:|foo |
SELECT format('|%-*s|', -10, 'foo'); Result:|foo |
以下の例はposition
フィールドの使い方を示しています。
SELECT format('Testing %3$s, %2$s, %1$s', 'one', 'two', 'three'); Result:Testing three, two, one
SELECT format('|%*2$s|', 'foo', 10, 'bar'); Result:| bar|
SELECT format('|%1$*2$s|', 'foo', 10, 'bar'); Result:| foo|
標準C関数sprintf
とは違って、PostgreSQLのformat
関数は、同一のフォーマット文字列の中でposition
フィールドがあるフォーマット指示子と、それがないフォーマット指示子の混在を許容します。
position
フィールドが無いフォーマット指示子は常に最終の引数が消費された後に次の引数を使用します。
さらに、format
関数はフォーマット文字列で使用されるべき全ての関数引数を要求しません。
例を示します。
SELECT format('Testing %3$s, %2$s, %s', 'one', 'two', 'three');
Result: Testing three, two, three
%I
および %L
のフォーマット指示子は特に動的SQL命令を安全に構築する場合に便利です。
例 42.1を参照してください。