他のバージョンの文書 16 | 15 | 14 | 13 | 12 | 11 | 10 | 9.6 | 9.5 | 9.4 | 9.3 | 9.2 | 9.1 | 9.0 | 8.4 | 8.3 | 8.2 | 8.1 | 8.0 | 7.4 | 7.3 | 7.2

73.1. データベースファイルのレイアウト #

本節ではファイルとディレクトリというレベルで格納書式について説明します。

伝統的に、データベースクラスタで利用される制御ファイルとデータファイルは、クラスタのデータディレクトリ内に一緒に格納され、通常(このディレクトリを定義するために使用できる環境変数名にちなんで)PGDATAとして参照されます。 通常のPGDATAの位置は/var/lib/pgsql/dataです。 異なるサーバインスタンスによって管理することで、複数のクラスタを同一のマシン上に存在させることができます。

表 73.1に示すように、PGDATAディレクトリには数個のサブディレクトリと制御ファイルがあります。 これら必要な項目に加え、クラスタの設定ファイルであるpostgresql.confpg_hba.confおよびpg_ident.confが、他の場所にも置くことができますが、伝統的にPGDATA内に格納されます

表73.1 PGDATAの内容

項目 説明
PG_VERSIONPostgreSQLの主バージョン番号を保有するファイル
baseデータベースごとのサブディレクトリを保有するサブディレクトリ
current_logfilesログ収集機構が現在書き込んでいるログファイルを記録するファイル
globalpg_databaseのようなクラスタで共有するテーブルを保有するサブディレクトリ
pg_commit_tsトランザクションのコミット時刻のデータを保有するサブディレクトリ
pg_dynshmem動的共有メモリサブシステムで使われるファイルを保有するサブディレクトリ
pg_logical論理デコードのための状態データを保有するサブディレクトリ
pg_multixactマルチトランザクションの状態のデータを保有するサブディレクトリ(共有行ロックで使用されます)
pg_notifyLISTEN/NOTIFY状態データを保有するサブディレクトリ
pg_replslotレプリケーションスロットデータを保有するサブディレクトリ
pg_serialコミットされたシリアライザブルトランザクションに関する情報を保有するサブディレクトリ
pg_snapshotsエクスポートされたスナップショットを保有するサブディレクトリ
pg_stat統計サブシステム用の永続ファイルを保有するサブディレクトリ
pg_stat_tmp統計サブシステム用の一時ファイルを保有するサブディレクトリ
pg_subtransサブトランザクションの状態のデータを保有するサブディレクトリ
pg_tblspcテーブル空間へのシンボリックリンクを保有するサブディレクトリ
pg_twophaseプリペアドトランザクション用の状態ファイルを保有するサブディレクトリ
pg_wal WAL(ログ先行書き込み)ファイルを保有するサブディレクトリ
pg_xactトランザクションのコミット状態のデータを保有するサブディレクトリ
postgresql.auto.confALTER SYSTEMにより設定された設定パラメータを格納するのに使われるファイル
postmaster.opts最後にサーバを起動した時のコマンドラインオプションを記録するファイル
postmaster.pid 現在のpostmasterプロセスID(PID)、クラスタのデータディレクトリパス、postmaster起動時のタイムスタンプ、ポート番号、Unixドメインソケットのディレクトリパス(空も可)、有効な監視アドレスの一番目(IPアドレスまたは*、TCPを監視していない場合は空)および共有メモリのセグメントIDを記録するロックファイル(サーバが停止した後は存在しません)

クラスタ内の各データベースに対して、PGDATA/base内にサブディレクトリが存在し、サブディレクトリ名はpg_database内のデータベースOIDとなります。 このサブディレクトリはデータベースファイルのデフォルトの位置であり、特にシステムカタログがそこに格納されます。

以下の節では、組み込みのheapテーブルアクセスメソッドと組み込みのインデックスアクセスメソッドの振舞いを説明していることに注意してください。 PostgreSQLの拡張性のため、他のアクセスメソッドは異なる動作をするかもしれません。

各テーブルおよびインデックスは別個のファイルに格納されます。 通常のリレーションでは、これらのファイル名はテーブルまたはインデックスのファイルノード番号となります。 ファイルノード番号はpg_class.relfilenode内で見つけられます。 しかし一時的なリレーションでは、ファイル名はtBBB_FFFという形になります。 ここでBBBはファイルを生成したバックエンドのバックエンドID、FFFはファイルノード番号です。 どちらの場合でも、主ファイル(いわゆる主フォーク)に加え、それぞれのテーブルとインデックスはリレーションに利用できる空き領域についての情報を格納する空き領域マップ73.3参照)を持ちます。 空き領域マップはファイルノード番号に接尾辞_fsmがついた名前のファイルに格納されます。 テーブルは同時に、どのページが無効なタプルを持っていないと判断できるように追跡する可視性マップを持ち、フォークに接尾辞_vmを付けたファイルに格納します。 可視性マップは73.4でより詳しく解説します。 ログを取らないテーブルとインデックスは、初期化フォークという第3のフォークを持ち、フォークに接尾辞_initを付けたファイルに格納します(73.5参照)。

注意

テーブルにおけるファイルノード番号とOIDは多くの場合一致しますが、常に一致するとは限らないことに注意してください。 TRUNCATEREINDEXCLUSTER等のいくつかの操作、およびALTER TABLEにおけるいくつかの構文は、OIDを保持したままファイルノード番号を変更できます。 ファイルノード番号とテーブルOIDが同一であると仮定しないでください。 またpg_class自身を含む特定のシステムカタログにおいて、pg_class.relfilenodeはゼロを持ちます。 これらのカタログの実際のファイルノード番号は低レベルなデータ構造内に保管されており、pg_relation_filenode()関数を使用して入手できます。

テーブルまたはインデックスが1ギガバイトを超えると、ギガバイト単位のセグメントに分割されます。 最初のセグメントのファイル名はファイルノード番号と同一であり、それ以降は、ファイルノード番号.1、ファイルノード番号.2等の名称になります。 この配置法によってファイル容量に制限のあるプラットフォームにおける問題を回避します。 (実際、1ギガバイトは単なるデフォルトのセグメント容量です。 セグメント容量はPostgreSQLを構築する際、--with-segsize設定オプションを使用して調整することができます。) 原理上、空き領域マップと可視性マップのフォークにおいても複数のセグメントも必要とする可能性がありますが、実際のところは起こりそうにありません。

項目が大きくなりそうな列を持ったテーブルは、連携したTOASTテーブルを保有する可能性があります。 TOASTテーブルは、テーブル行の中には大き過ぎて適切に保持できないフィールド値を行の外部に格納するために使用されます。 TOASTテーブルが存在する時、pg_class.reltoastrelidは元のテーブルとTOASTテーブルを結びつけます。 73.2を参照してください。

テーブルおよびインデックスの内容は、73.6においてさらに考察されています。

テーブル空間は状況をさらに複雑にします。 ユーザが定義したテーブル空間はそれぞれ、PGDATA/pg_tblspcディレクトリ内に物理的なテーブル空間ディレクトリ(つまりそのテーブル空間のCREATE TABLESPACEコマンドで指定された場所)を指し示す、シンボリックリンクを持ちます。 シンボリックリンクの名称はテーブル空間のOIDとなります。 物理的テーブル空間ディレクトリの内部では、PG_9.0_201008051などのPostgreSQLサーバのバージョンに依存した名前のサブディレクトリが存在します。 (このサブディレクトリを使用する理由は、競合することなくCREATE TABLESPACEで指定する場所と同じものを将来のバージョンのデータベースでも使用できるようにするためです。) このバージョン固有のサブディレクトリの内部では、テーブル空間に要素を持つデータベースごとに、データベースOIDをディレクトリ名としたサブディレクトリが存在します。 テーブルとインデックスは、ファイルノードの命名の規定に従って、そのディレクトリ内に格納されます。 pg_defaultテーブル空間は pg_tblspcを通してアクセスされるのではなく、PGDATA/baseと連携します。 同様に、pg_globalテーブル空間はpg_tblspcを通してアクセスされるのではなく、PGDATA/globalと連携します。

pg_relation_filepath()関数は任意のリレーションの(PGDATAから相対的な)パス全体を示します。 これは上の規則の多くを記憶する必要がありませんので、しばしば有用です。 しかし、この関数がリレーションの主フォークの最初のセグメントの名前だけを返すことに注意して下さい。 リレーションに関したすべてのファイルを見つけるためにセグメント番号や_fsm_vm_initを追加する必要があるかもしれません。

一時ファイル(メモリ内に収まりきらないデータのソートなどの操作用)はPGDATA/base/pgsql_tmp内、または、pg_default以外のテーブル空間が指定されていた場合はテーブル空間ディレクトリ下のpgsql_tmpサブディレクトリ内に作成されます。 一時ファイルの名前はpgsql_tmpPPP.NNNという形式です。 ここで、PPPは所有するバックエンドのPIDであり、NNNで同一バックエンドで作成された別の一時ファイルと区別します。