Veröffentlicht am: Apr 21, 2020
Amazon Elasticsearch Service unterstützt ab sofort das Hinzufügen benutzerdefinierter Wörterbücher zu Ihren Domains. Sie können Synonyme, Stoppwörter und Segmentierungsdateien angeben, um Indizierung, Typzuweisung und Suchrelevanz zu optimieren. Bisher konnten Sie solche Anpassungen nur direkt in die Typzuweisung integrieren, was ihre Nutzung umständlich und schwierig machte.
Synonyme bieten die Möglichkeit, mit Treffern gleichbedeutende Begriffe zu erfassen. Sie können als Synonym beispielsweise „eins-> 1“ definieren, um alle Treffer zu erhalten, die diese beiden gleichbedeutenden Suchbegriffe enthalten. Stoppwörter sind häufige Begriffe mit geringer inhaltlicher Relevanz wie „ein, eine, und der“, die keine Bedeutung für die Ermittlung oder Relevanz des Ergebnisses haben. Diese Wörter werden aus Abfragen und Indizes entfernt. Ein benutzerdefiniertes Segmentierungswörterbuch ist besonders wichtig, um die bestmögliche Indizierung von freiem Text in asiatischen Sprachen und in Deutsch zu gewährleisten. Diese Sprachen haben Komposita oder Zeichen, die je nach Kontext und Zusammenstellung unterschiedliche Bedeutungen haben können. Das Segmentierungswörterbuch dient zur Optimierung der Verwendung solcher Begriffe.
Mit der Unterstützung für benutzerdefinierte Wörterbücher kann Amazon Elasticsearch Service ab sofort Wörterbuchdateien aus Amazon S3 importieren und nach Bedarf mit Ihren Amazon Elasticsearch Service-Domains verknüpfen. Die Unterstützung für benutzerdefinierte Wörterbücher ist für alle Elasticsearch-Versionen auf Amazon Elasticsearch Service verfügbar. Weitere Informationen finden Sie in der Dokumentation.
Die Unterstützung benutzerdefinierter Wörterbücher für Amazon Elasticsearch Service-Domains ist jetzt in 21 Regionen weltweit verfügbar: USA Ost (North Virginia, Ohio), USA West (Oregon, Nordkalifornien), AWS GovCloud (USA-Gov-Ost, USA-Gov-West), Kanada (Zentral), Südamerika (São Paulo), EU (Irland, London, Frankfurt, Paris, Stockholm), Asien-Pazifik (Singapur, Sydney, Tokio, Seoul, Mumbai, Hongkong) und China (Peking, von Sinnet betrieben, und Ningxia, von NWCD betrieben). Informationen zur Verfügbarkeit des Amazon Elasticsearch Service finden Sie in der AWS-Regionentabelle.