適正にインストールされ、かつ、すべての機能が使用できるようなPostgreSQLインストレーションであっても、浮動小数点の表現やメッセージ内の単語順など、プラットフォーム特有の誤差のために「失敗」することがあります。
現在のテストは単純に、(基準となる)参照用システムで生成した出力とのdiff
を取ることで結果の検証を行っているため、システムの些細な違いにも反応します。
結果が「失敗」となった場合は、予測された結果と実際の結果との差分を必ず評価してください。
それらの差異が重大ではないことが判明することもあります。
なお、すべてのテストが成功するように、サポートするすべてのプラットフォームに対する正確な参照ファイルの保守に努めています。
実際のリグレッションテストの出力は、src/test/regress/results
ディレクトリ内のファイルに書き込まれます。
テストスクリプトはdiff
を使用して、各出力ファイルとsrc/test/regress/expected
ディレクトリ内の参照用出力とを比較します。
あらゆる差異は調査用にsrc/test/regress/regression.diffs
に保存されます。
(コアテスト以外のテストスイートを実行する場合には、上記のファイルはもちろんsrc/test/regress
ではなく適切なサブディレクトリに現れます。)
デフォルトで利用されているdiff
オプションが気に入らなければ、例えばPG_REGRESS_DIFF_OPTS='-c'
のように、環境変数PG_REGRESS_DIFF_OPTS
を設定して下さい。
(あるいは、自分でdiff
を実行することもできます。)
何らかの理由で、特定のプラットフォームが指定した試験で「失敗」し、その出力の調査により結果の方が有効であると確信できた場合、新しい比較用ファイルを追加し、今後の試験で失敗の報告が発生しないようにすることができます。 詳細は33.3を参照してください。
リグレッションテストのいくつかは、意図的に無効な入力値を使用します。 エラーメッセージはPostgreSQLのコードによるもの、または使用しているプラットフォームの関数によるものがあります。 後者の場合、プラットフォームによって違いがあるかもしれませんが、似たような内容になるはずです。 これらのメッセージの違いによりリグレッションテストは「失敗」する可能性がありますが、これらは検査で確認できます。
Cロケール以外の照合順序のロケールで初期化されたサーバに対してテストを実行する際には、ソート順やその後に発生する失敗に違いが生じる可能性があります。 リグレッションテストスイートはこの問題を解決するために、多くのロケールを処理するための代替の結果ファイルを提供するように設定されています。
一時的なインストレーションを使用して、異なるロケールのテストを実行するためには、以下の例のように、make
コマンドラインに適切なロケール関連の環境変数を渡してください。
make check LANG=de_DE.utf8
(リグレッションテストのドライバはLC_ALL
を設定しないため、この変数を使ってロケールを選択することはできません。)
ロケール無しを使用するためには、すべてのロケール関連の環境変数を設定しない(または、それらをC
に設定する)か、もしくは以下の特殊な起動を行います。
make check NO_LOCALE=1
既存のインストレーションに対してテストを実行する場合は、ロケール設定は既存のインストレーションによって決まります。
変更するためには、initdb
に適切なオプションを渡して、異なるロケールでデータベースクラスタを初期化してください。
実際に実運用で使用されるロケールおよび符号化方式に関連した部分のコードが検証されますので、一般的には、実運用で使用されるロケール設定でリグレッションテストを実行することを推奨します。 オペレーティングシステム環境に依存して、結果が失敗する場合もありますが、少なくとも実際のアプリケーションを実行する時に想定されるロケール固有の動作を知ることができます。
日付と時刻の結果のほとんどはタイムゾーンの環境に依存します。
参照ファイルはタイムゾーン PST8PDT
(Berkeley, California) 用に生成されているため、このタイムゾーン設定で実行されていないテストは明らかに失敗します。
リグレッションテストのドライバは、適切な結果を保証するために、環境変数PGTZ
にPST8PDT
を設定します。
いくつかのテストでは、64ビット(double precision
型)の浮動小数点数値をテーブルの列から取り出して計算を行います。
double precision
列における数学演算関数では、異なった結果が発生する場合があることが知られています。
float8
とgeometry
テストは特に、プラットフォーム間、またはコンパイラの最適化の設定による小さな違いが起こりやすくなります。
これらの違い、通常は小数点以下10桁目以降の相違の、実際の影響度を判断するためには、人間の目で実際に確認する必要があります。
いくつかのシステムではマイナス0を-0
と表示することがあり、その他のシステムでは単に0
と表示します。
いくつかのシステムでは、現在のPostgreSQLのコードが想定しているメカニズムと異なるために、pow()
とexp()
でエラーを発生する場合があります。
同じ行の出力が、参照ファイルで記述されている順序とは異なっている場合があります。
ほとんどの場合、これは厳密に言ってバグではありません。
ほとんどのリグレッションテストは、各SELECT
文に対してORDER BY
を使用するほど規則に厳しくなく、そのため、結果の行の順序はSQLの仕様に従って、明確に決まっていません。
実際には、同じソフトウェアで同じデータを用いて同じ問い合わせで参照しているので、すべてのプラットフォームで同じ順序の結果が返されるため、ORDER BY
がないことは問題ではないと言えます。
しかし、問い合わせによっては、プラットフォーム間の順序の違いが起こる可能性があります。
インストール済みのサーバに対して試験を行う場合、C以外のロケール、独自のwork_mem
や独自のプランナ用のコストパラメータなどデフォルト以外のパラメータ設定により順序の違いが生じる可能性があります。
したがって、順序の違いを見つけた場合、問い合わせにORDER BY
が含まれていて順序が影響を及ぼす場合以外は、気にする必要はありません。
ただし、その場合にもとにかくご一報ください。特定の問い合わせから偽の「失敗」を取り除くために、将来のリリースにおいて、ORDER BY
を追加します。
このような問題を避けるために、なぜ我々がすべてのリグレッションテストに対して明示的に順序を指定しないのか、疑問に思うかもしれません。 その理由は、ソートが必要がない場合であってもソートされた結果を生成する問い合わせ計画を実行しようとすることによって、リグレッションテストの意義が増すわけではなく、むしろ減るからです。
errors
テストがselect infinite_recurse()
コマンドでサーバをクラッシュさせた場合、プラットフォームのプロセススタックサイズがmax_stack_depthパラメータが示す値よりも小さいことを意味します。
これは、スタックサイズ制限を高くして(デフォルトのmax_stack_depth
での推奨値は4メガバイト)サーバを実行することで修正することができます。
これを行うことができない場合、max_stack_depth
の値を少なくすることが代替方法です。
getrlimit()
をサポートするプラットフォームでは、サーバは自動的にmax_stack_depth
の安全な値を選ぶべきです。
この設定を手で上書きしたのでない限り、この種の失敗は報告する価値のあるバグです。
random
テストスクリプトは、無作為な結果を生成することを目的としています。
非常に稀ですが、これがリグレッションテストが失敗する原因になることがあります。
次のように、
diff results/random.out expected/random.out
と入力すると、ほんの数行だけの差異が生じるはずです。 繰り返し失敗しない限り、気に留める必要はありません。
既存のインストレーションに対してテストを実行する場合、デフォルトでないパラメータ設定はテストが失敗する原因になり得ます。
例えば、enable_seqscan
やenable_indexscan
のようなパラメータの変更は、EXPLAIN
を使うテストの結果に影響する計画の変更の原因となり得ます。