Publicado: Apr 21, 2020
O Amazon Elasticsearch Service agora oferece suporte à inclusão de arquivos de dicionário personalizados em seus domínios. Você pode especificar arquivos de sinônimos, palavras de parada e segmentação para melhorar a indexação, a correspondência e a relevância da pesquisa. Anteriormente, só era possível incluir esses tipos de personalizações diretamente no mapeamento, o que podia complicar e dificultar o gerenciamento.
Os sinônimos são um meio de expandir as correspondências e fornecer conceitos semelhantes. Por exemplo, você pode especificar o sinônimo “um -> 1” para que corresponda a qualquer pesquisa que contenha esses conceitos relacionados. Palavras de parada são termos comuns e de baixo valor, como “um, uma e o/a” que não contribuem positivamente para a correspondência ou a relevância. Essas palavras são removidas dos índices e das consultas. O uso de um dicionário de segmentação personalizado é particularmente importante para garantir a melhor indexação de texto livre em idiomas asiáticos e alemão. Esses idiomas têm termos compostos e caracteres que podem ter diferentes significados de acordo com o contexto e com a maneira como são separados. Um dicionário de segmentação é usado para controlar rigorosamente essa decomposição dos termos.
Com o suporte de dicionários personalizados, o Amazon Elasticsearch Service agora pode importar arquivos de dicionário do Amazon S3 e disponibilizá-los para serem associados ao(s) domínio(s) do Amazon Elasticsearch Service quando necessário. O suporte a dicionários personalizados está disponível para todas as versões do Elasticsearch no Amazon Elasticsearch Service. Para saber mais, consulte a documentação.
O suporte a dicionários personalizados agora está disponível para domínios do Amazon Elasticsearch Service em 21 regiões no mundo todo: Leste dos EUA (Norte da Virgínia, Ohio), Oeste dos EUA (Oregon, Norte da Califórnia), AWS GovCloud (US-Gov-East, US-Gov-West), Canadá (Central), América do Sul (São Paulo), UE (Irlanda, Londres, Frankfurt, Paris, Estocolmo), Ásia-Pacífico (Singapura, Sydney, Tóquio, Seul, Mumbai, Hong Kong) e China (Pequim – operada pela Sinnet, Ningxia – operada pela NWCD). Consulte a Tabela de regiões da AWS para obter mais informações sobre a disponibilidade do Amazon Elasticsearch Service.