PostgreSQLのテキスト検索機能の制限事項は以下です。
各々の語彙素の長さは2Kバイト未満でなければなりません
tsvector
の長さ (語彙素 + 位置)は1Mバイト未満でなければなりません
語彙素の数は264未満でなければなりません
tsvector
の位置量は、0より大きくかつ16,383以下でなければなりません
tsquery
演算子<
におけるマッチの距離は16,384より大きくすることはできませんN
>
語彙素の位置情報は256以下でなければなりません
tsquery
中のノードの数(語彙素 + 演算子)は32,768未満でなければなりません
比較対象として述べておくと、PostgreSQL8.1 のドキュメントは10,441のユニークな単語を含み、全部の単語数は335,420で、最頻出の単語「postgresql」は655の文書中に6,127回出現しました。
別の例です — PostgreSQLメーリングリストのアーカイブは910,989のユニークな単語を含み、461,020のメッセージ中に57,491,343の語彙素がありました。