Publicado en: Nov 19, 2021
Hoy nos complace anunciar que Amazon Athena es compatible con los índices de partición del catálogo de datos de AWS Glue para optimizar la planificación de las consultas y reducir el tiempo de ejecución de las mismas. Cuando se consulta una tabla que contiene un gran número de particiones, Athena recupera las particiones disponibles del catálogo de datos de AWS Glue y determina cuáles son necesarias para la consulta. A medida que se agregan nuevas particiones, el tiempo necesario para recuperar las particiones aumenta y puede hacer que aumente el tiempo de ejecución de la consulta. El catálogo de datos de AWS Glue permite a los clientes crear índices de partición que reducen el tiempo necesario para recuperar y filtrar metadatos de partición en tablas con decenas y cientos de miles de particiones.
El uso de los índices de partición con Athena es un proceso sencillo de dos pasos. Comience seleccionando las columnas que desea indexar en el catálogo de datos de Glue e inicie la creación del índice. A continuación, habilite el filtrado de particiones en las tablas y vuelva a Athena para ejecutar la consulta. Para obtener más información, consulte Indexación y filtrado de la partición de AWS Glue.
Los índices de partición son compatibles con las tablas nuevas y las existentes, por lo que no es necesario reconstruir los conjuntos de datos ni reescribir las consultas para obtener los beneficios de rendimiento. Para obtener más información, consulte Mejorar el rendimiento de las consultas de Amazon Athena mediante los índices de partición del catálogo de datos de AWS Glue.
Los índices de partición también benefician a las cargas de trabajo de análisis que se ejecutan en Amazon EMR, Amazon Redshift Spectrum y AWS Glue, además de Amazon Athena. Para obtener más información, consulte Mejorar el rendimiento de las consultas mediante los índices de partición de AWS Glue.