SQLは強く型付けされた言語です。つまり、各データ項目は、その動作と許される使用方法を決定するデータ型を所有しています。PostgreSQLは、他の RDBMSの実装よりもより一般的で柔軟性のある、拡張可能な型システムを持ちます。ゆえに、 PostgreSQLでのほとんどの型変換の動作は、ユーザー定義型についても型の混在する式を有意義に使えるように、特定の目的について勝手に作り上げられることなく一般的なルールで管理されるべきです。
PostgreSQLのスキャナ/パーサーは字句要素を、整数、浮動小数点、文字列、名前、キーワードというわずか5個の基礎カテゴリに解読します。ほとんどの拡張された型は、まず文字列にトークン化されます。SQL言語定義では、文字列で型の名前を指定することを許しており、この手法はパーサーが正しい手順に沿って処理を始められるようにPostgreSQLによって使用されています。たとえば、以下のような問い合わせを考えてみましょう。
tgl=> SELECT text 'Origin' AS "Label", point '(0,0)' AS "Value"; Label | Value --------+------- Origin | (0,0) (1 row)
この問い合わせは、textとpointという2つの型を指定した文字列定数を持ちます。型が指定されていない場合、後述するように、後の段階で解決されるように、とりあえず場所を確保するための型であるunknownが割り当てられます。
PostgreSQLのパーサには、個別の型変換ルールが必要な4つの基礎的なSQL構成要素があります。
PostgreSQLでは、(引数が2つである)二項演算子と同様に、(引数が1つである)前置、後置演算子を持つ式が使用できます。
PostgreSQLの型システムの多くは、多くの関数の集合を持って構築されています。ある特定の問い合わせにおける関数呼び出しは引数を1つ以上もち、システムカタログ内で使用可能とされている関数定義に一致していなければいけません。 PostgreSQLは関数のオーバーロードを許可するので、関数名のみでは呼び出される関数を一意に識別しません。パーサが、与えられる引数のデータ型に基づいて正しい関数を選択しなければいけません。
SQLのINSERTと UPDATE文は式の結果をテーブルの中に格納します。問い合わせ内の式は対象となるカラムの型に一致する、または、変換できるものである必要があります。
UNIONを構成するSELECT文からの選択結果はすべて、ある1つの列集合に現れなければいけませんので、各SELECT句の型は統一された集合に一致し変換できる必要があります。同様に、CASE式が全体として既知の出力型を持つようになるために、CASE構成要素の結果式は共通の型を強制する必要があります。
一般的な型の変換ルールの多くは、PostgreSQL関数と演算子のシステムテーブルに組み込まれている簡単な規定を使用します。 smallint、integer、realといった、 SQL標準に固有の型用の規定をよりうまくサポートするために、変換ルールには特別に用意されたものもあります。
PostgreSQLパーサは、すべての型変換関数は変換元となる型の引数を1つとり、対象とする型と同じ名前の関数名となっているという規定を用いています。この基準に従う関数はすべて、有効な変換関数とみなされ、パーサによって変換関数として使用される可能性があります。この簡単な仮定によって、パーサは、直接コード内に記述することなく型変換を表現できます。ですから、拡張されたユーザー定義型はこの機能を透過的に使用できるわけです。
更に、SQL標準型用の適切な動作をうまく推測できるようにするための発見的方法がパーサに提供されています。基本的な 型カテゴリは、ブール値、数値、 文字列、ビット文字列、日付、 時間、幾何学データ、ネットワーク、 ユーザ定義があります。ユーザ定義を除いた各カテゴリは、あいまいさがある場合に優先的に選択される好ましい型を持ちます。ユーザ定義カテゴリでは、それぞれの型はそれ自身の好ましい型です。あいまいな式(複数の解析結果侯補を持つもの)は、複数の可能な組み込み型があったとしてもしばしば解決できますが、複数のユーザー定義型選択肢がある場合にはエラーが発生します。
すべての型変換ルールは次のようないくつかの基本的な考え方に基づいて設計されています。
暗黙的な変換は、びっくりするような、あるいは、予想できない結果を持つべきではない。
パーサがあらかじめ知ることのないユーザー定義型は型の階層内で"より高位"にあるべきです。型が混在する式では、固有型は常にユーザー定義型に変換されます(もちろん、変換が必要なときのみです)。
ユーザー定義型は関係を持ちません。現時点では、 PostgreSQLは型の間における関係について、組み込み型用に直接コードで特別に作成したものと、カタログ内の使用可能な関数に基づいた暗黙的な関係を除いては、有効な情報を保有していません。
暗黙的な型変換を必要としない問い合わせの場合、パーサやエクザキュータに余計なオーバヘッドがあるべきではありません。つまり、問い合わせがきちんとまとめられ、型がすでに一致するものになっていれば、パーサ内で余計な時間を費やすことがなく、また、問い合わせに不要な暗黙的な型変換関数が使用されないように問い合わせは処理されるべきです。
さらに、もし問い合わせが通常は関数を使った暗黙的な変換を要求していたものであり、そして、ユーザが正しい引数型をもつ関数を明示的に定義した場合、パーサはこの新しい関数を使い、古い関数を使った暗黙的な変換を行わないようにすべきです。