ワードブレーカとステミング機能

[アーティクル]
12/15/2008

ワードブレーカとステミング機能は、すべてのフルテキストインデックスデータに対して言語分析を実行します。言語分析には、単語の境界 (単語の区切り) の検索と動詞の活用 (ステミング) が含まれます。この分析の規則は言語によって異なり、フルテキストインデックス列ごとに言語を指定できます。各言語用にワードブレーカを用意することで、その言語に対する検索結果の精度が高くなります。言語ファミリにはワードブレーカが存在していても、特定のサブ言語は対象とされない場合は、主言語が使用されます。たとえば、カナダ系フランス語テキストの処理には、フランス語のワードブレーカが使用されます。特定の言語用のワードブレーカが使用できない場合は、ニュートラルワードブレーカが使用されます。ニュートラルワードブレーカを使用すると、単語は空白や句読点などのニュートラル文字で分割されます。

Microsoft SQL Server 2005 には、23 のロケール用のワードブレーカが含まれています。フルテキスト検索でサポートされている言語の一覧については、「sys.fulltext_languages (Transact-SQL)」を参照してください。

クエリ対象のフルテキストインデックス列の言語によって、フルテキストクエリ関数である CONTAINS、FREETEXT、CONTAINSTABLE、および FREETEXTTABLE の引数で実行される言語分析が決まります。列に言語が指定されていない場合、既定では構成オプション default full-text language の値になります。

SQL Server のローカライズされたバージョンでは、適切な言語が存在する場合は SQL Server セットアップによって、default full-text language オプションはサーバーの言語に設定されます。SQL Server のローカライズされていないバージョンでは、default full-text language オプションは英語になります。

メモ :
1 つのフルテキストクエリ関数句に指定されるすべての列は、クエリで LANGUAGE オプションが指定されていない限り、同じ言語を使用する必要があります。

参照

Share via

ワードブレーカとステミング機能

参照

概念

その他の技術情報

ヘルプおよび情報

その他のリソース

Share via

ワード ブレーカとステミング機能

参照

概念

その他の技術情報

ヘルプおよび情報

その他のリソース

ワードブレーカとステミング機能