Publicado en: Jun 26, 2020
Amazon Athena ha agregado compatibilidad con la proyección de particiones, una nueva función que puede utilizar para acelerar el procesado de consultas de tablas altamente particionadas y automatizar la administración de particiones.
Al procesar consultas, Athena recupera información de metadatos desde su almacén de metadatos, como el catálogo de datos de AWS Glue o el metaalmacén de Hive, antes de realizar la división. En aquellos casos en los que las tablas tengan un número elevado de particiones, recuperar los metadatos puede llevar mucho tiempo. Para evitarlo, puede utilizar la proyección de particiones. La partición de proyecciones le permite especificar información de configuración como los patrones (por ejemplo, DD/MM/AAAA) que se utilizan de forma común para dar forma a las particiones. De este modo, Athena obtiene la información necesaria para crear particiones sin tener que recuperar información de metadatos de su almacén de metadatos. Athena leerá las ubicaciones y valores de partición en la configuración, en lugar de en un repositorio como el catálogo de datos de AWS Glue. La proyección de particiones reduce el tiempo de ejecución de las consultas en comparación con las tablas altamente particionadas, dado que las operaciones en memoria son con frecuencia más rápidas que las operaciones remotas.
Visite nuestra documentación para obtener información detallada y ejemplos de uso.