投稿日: Apr 21, 2020
Amazon Elasticsearch Service が、カスタム辞書ファイルをドメインに追加するためのサポートを提供するようになりました。シノニム、ストップワード、セグメンテーションファイルを指定して、インデックス作成、マッチング、検索の関連性を向上させることができます。以前は、これらのタイプのカスタマイズをマッピングに直接含めることしかできなかったため、扱いにくくて管理するのが困難でした。
シノニムは、類似の概念に沿って一致結果を拡張する手段を提供します。たとえば、シノニムを「one-> 1」に指定して、これらの関連概念を含むすべてのクエリに一致させることができます。ストップワードは、「a、an、the」のようにあまりに一般的で価値が低い用語であるため、一致や関連性に積極的に貢献することはありません。これらのワードはインデックスとクエリから削除されます。アジア言語とドイツ語でフリーテキストを最適にインデックス化するためには、特にカスタムのセグメンテーション辞書を使用することが大事です。これらの言語には、文脈、そして言語が分割されている形によって異なる意味を持つ可能性がある複合語または複合文字があるからです。セグメンテーション辞書を使用して、この分解を厳密に制御します。
カスタム辞書のサポートにより、Amazon Elasticsearch Service は Amazon S3 から辞書ファイルをインポートし、必要に応じて辞書ファイルを Amazon Elasticsearch Service ドメインに関連付けられるようになります。カスタム辞書のサポートは、Amazon Elasticsearch Service の Elasticsearch のすべてのバージョンでご利用いただけます。詳細については、ドキュメントを参照してください。
カスタム辞書のサポートは、世界各地の 21 のリージョンにわたる Amazon Elasticsearch Service ドメインで使用できます。それらのリージョンは、米国東部 (バージニア北部、オハイオ)、米国西部 (オレゴン、北カリフォルニア)、AWS GovCloud (米国東部、米国西部)、カナダ (中部)、南米 (サンパウロ)、欧州 (アイルランド、ロンドン、フランクフルト、パリ、ストックホルム)、アジアパシフィック (シンガポール、シドニー、東京、ソウル、ムンバイ、香港)、中国 (北京 – Sinnet による運営、寧夏 – NWCD による運営) です。Amazon Elasticsearch Service の提供状況の詳細については、AWS リージョンの表をご覧ください。