本節ではファイルとディレクトリというレベルで格納書式について説明します。
データベースクラスタで必要となる全てのデータは、クラスタのデータディレクトリ内に格納され、通常PGDATAとして参照されます (そのディレクトリを定義するために使用できる環境変数名です)。 通常のPGDATAの位置は/var/lib/pgsql/dataです。 複数のクラスタは異なったサーバによって管理され、同一のマシン上に存在できます。
表53-1で示されているようにPGDATAディレクトリには数個のサブディレクトリと制御ファイルがあります。 これら必要な項目に加え、クラスタの設定ファイルであるpostgresql.conf、pg_hba.confおよびpg_ident.confが従来通りPGDATA内に格納されます (PostgreSQL 8.0 以降では他の場所にも保存できます)。
表 53-1. PGDATAの内容
項目 | 記述 |
---|---|
PG_VERSION | PostgreSQLの主バージョン番号を保有するファイル |
base | データベースごとのサブディレクトリを保有するサブディレクトリ |
global | pg_databaseのようなクラスタで共有するテーブルを保有するサブディレクトリ |
pg_clog | トランザクションのコミット状態のデータを保有するサブディレクトリ |
pg_multixact | マルチトランザクション状態のデータを保有するサブディレクトリ(共有行ロックで使用されます) |
pg_stat_tmp | 統計用サブシステムのための一次ファイルを含むサブディレクトリ |
pg_subtrans | サブトランザクションの状態のデータを保有するサブディレクトリ |
pg_tblspc | テーブル空間へのシンボリックリンクを保有するサブディレクトリ |
pg_twophase | プリペアドトランザクション用の状態ファイルを保有するサブディレクトリ |
pg_xlog | WAL(ログ先行書き込み)ファイルを保有するサブディレクトリ |
postmaster.opts | 最後にサーバを起動したコマンドラインのオプションを記録するファイル |
postmaster.pid | 実行中のサーバのPIDおよび共有メモリのセグメントIDを記録するロックファイル(サーバが停止した後は存在しません) |
クラスタ内の各データベースに対して、PGDATA/base内にサブディレクトリが存在し、サブディレクトリ名はpg_database内のデータベースOIDとなります。 このサブディレクトリはデータベースファイルのデフォルトの位置であり、特にシステムカタログがそこに格納されます。
各テーブルおよびインデックスは別個のファイルに格納され、ファイル名はテーブルまたはインデックスのファイルノード番号となり、pg_class.relfilenode内で検索できます。主ファイル(いわゆる主フォーク)に加え、それぞれのテーブルとインデックスは関係に利用できる空き領域についての情報を格納する空き領域マップ(free space map)(項53.3参照)を所有しています。空き領域マップはファイルノード番号に_fsmがついて指定されたファイルに格納されます。 テーブルは同時に、どのページが不必要なタプルを持っていないと判断できるように追跡する_vmが添え字となったフォークに格納される可視性マップを所有しています。 可視性マップは項53.4でより深く解説されています。
注意 |
テーブルにおけるファイルノード番号とOIDは多くの場合一致しますが、常に一致するとは限らないことに注意してください。 TRUNCATE、REINDEX、CLUSTER等のいくつかの操作、およびALTER TABLEにおけるいくつかの形式は、OIDを保持したままファイルノード番号を変更できます。 ファイルノード番号とテーブルOIDが同一であると仮定しないでください。 |
テーブルまたはインデックスが1ギガバイトを超えると、ギガバイト単位のセグメントに分割されます。 最初のセグメントのファイル名はファイルノード番号と同一であり、それ以降は、filenode.1、filenode.2等の名称になります。 この配置法によってファイル容量に制限のあるプラットフォームにおける問題を回避します。 (実際、1GBは単にデフォルトのセグメント容量です。セグメント容量はPostgreSQLを構築する際、--with-segsizeオプション設定を使用して調整することができます。) 原則として、空き領域マップと可視性マップのフォークは複数セグメントも必要としますが、実際のところは起こりそうにありません。テーブルおよびインデックスの内容は、項53.5においてさらに考察されています。
エントリが大きくなりそうな列を持ったテーブルは、連携したTOASTテーブルを保有する可能性があります。 TOASTテーブルは、元のテーブルの行の中には大き過ぎて保持できないフィールド値を格納するために使用されます。 pg_class.reltoastrelidはTOASTテーブルが存在する時、元のテーブルから参照します。
テーブル空間は状況をさらに複雑にします。 ユーザが定義したテーブル空間は、PGDATA/pg_tblspcディレクトリ内部へのシンボリックリンクを保有し、(CREATE TABLESPACEコマンドで指定された)物理的テーブル空間ディレクトリを参照します。 シンボリックリンクの名称はテーブル空間のOIDとなります。 物理的テーブル空間ディレクトリ内部では、テーブル空間に要素を持つ各データベースに対してサブディレクトリが存在し、サブディレクトリ名はデータベースOIDとなります。 そのディレクトリ内のテーブルは、ファイルノードの命名の規定に従います。 pg_defaultテーブル空間は pg_tblspcからアクセスされるのではなく、PGDATA/baseと連携します。 同様に、pg_globalテーブル空間はpg_tblspcからアクセスされるのではなく、PGDATA/globalと連携します。
一時ファイル(メモリ内に収まる以上のデータのソート操作用)はPGDATA/base/pgsql_tmp内、または、pg_default以外のテーブル空間が指定されていた場合はテーブル空間ディレクトリ下のpgsql_tmpサブディレクトリ内に作成されます。 一時ファイルの名前はpgsql_tmpPPP.NNNという形式です。 ここで、PPPは所有するバックエンドのPIDで、NNNで同一バックエンドで作成された別の一時ファイルと区別します。