AnalysisOptions - Amazon CloudSearch

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AnalysisOptions

説明

分析スキームのシノニム、ストップワード、ステミングオプション。日本語のトークン分割ディクショナリを含みます。

内容

AlgorithmicStemming

実行するアルゴリズムによるステミングのレベル。noneminimallight、または full。使用可能なレベルは言語によって異なります。詳細については、「Amazon CloudSearch デベロッパーガイド」の「言語固有のテキスト処理設定」を参照してください。

型: 文字列

有効な値:none | minimal | light | full

必須:いいえ

JapaneseTokenizationDictionary

日本語トークン分割の用語、トークン、読みおよび品詞のコレクションを含む JSON 配列。日本語トークン分割ディクショナリは、指定された用語のデフォルトのトークン分割を上書きできます。これは日本語の言語フィールドにのみ有効です。

タイプ: 文字列

必須: いいえ

StemmingDictionary

文字列:値のペアのコレクションを含む JSON のオブジェクトで、それぞれが用語をその語幹にマッピングします。例えば、{"term1": "stem1", "term2": "stem2", "term3": "stem3"}です。アルゴリズムステミングに加えて、ステミングディクショナリが適用されます。これによって、アルゴリズムステミングの結果をオーバーライドし、特定のステミングの過剰または不足のケースを修正できます。ステミングディクショナリの最大サイズは 500 KB です。

タイプ: 文字列

必須: いいえ

Stopwords

インデックス作成時および検索時に無視する用語の JSON 配列。例えば、 ["a", "an", "the", "of"]。ストップワードディクショナリでは、無視する各単語を明示的にリストする必要があります。ワイルドカードや正規表現はサポートされていません。

タイプ: 文字列

必須: いいえ

Synonyms

シノニムグループおよびエイリアスを定義する JSON オブジェクト。シノニムグループは配列の配列で、各サブ配列は、グループ内の各用語がグループ内の他のすべての用語のシノニムであると見なされる用語のグループです。エイリアス値は、文字列:値のペアのコレクションを含むオブジェクトで、文字列が用語を指定し、値の配列がその用語のエイリアスをそれぞれ指定します。エイリアスは指定した用語のシノニムと見なされますが、用語はエイリアスのシノニムとは見なされません。シノニムの指定の詳細については、「Amazon CloudSearch デベロッパーガイド」の「シノニム」を参照してください。

タイプ: 文字列

必須: いいえ