发布于: Apr 21, 2020
Amazon Elasticsearch Service 现在提供将自定义词典文件添加到您的域中的支持。现在,您可以指定同义词、停止词和分割文件来提高您的索引、匹配和搜索相关性。以前,您只能将这些自定义类型直接包含在您的映射中,这样会让它们变得庞大,难以处理。
同义词提供根据类似概念扩展匹配项的方式。例如,您可以指定同义词“one-> 1”来匹配包含这些相关概念的任何查询。停止词是常见的低值术语,如“a、an 和 the”,不会对匹配或相关性作出积极贡献。这些词将从索引和查询中删除。使用自定义分割字典对于确保亚洲语言和德语自由文本的最佳索引特别重要。这些语言包含很多复合词或字,根据上下文和它们的拆分方式,可能表示不同的意思。您可以使用分割字典来严格控制这种分解。
有了对自定义字典的支持,Amazon Elasticsearch Service 现在可以从 Amazon S3 中导入您的字典文件,并根据需要将它们与您的 Amazon Elasticsearch Service 域关联起来。Amazon Elasticsearch Service 上的所有 Elasticsearch 版本现在都支持自定义字典。有关更多信息,请参阅文档。
Amazon Elasticsearch Service 现已在全球 21 个区域推出自定义字典支持:美国东部(弗吉尼亚北部、俄亥俄)、美国西部(俄勒冈、加利福尼亚北部)、AWS GovCloud(US-Gov-East、US-Gov-West)、加拿大(中部)、南美洲(圣保罗)、欧洲(爱尔兰、伦敦、法兰克福、巴黎、斯德哥尔摩)、亚太地区(新加坡、悉尼、东京、首尔、孟买、香港)和中国(北京 – 由光环新网运营、宁夏 – 由西云数据运营)。有关 Amazon Elasticsearch Service 可用性的更多信息,请参阅 AWS 区域表。