Publicado en: Dec 3, 2019

Ahora puede descargar el resultado de una consulta de Amazon Redshift en un lago de datos de Amazon S3 como Apache Parquet, un formato de almacenamiento en columnas abierto y eficiente para análisis. El formato de parquet es hasta 2 veces más rápido de descargar y consumes hasta 6 veces menos almacenamiento en Amazon S3, en comparación con los formatos de texto. Esto le permite guardar transformación y enriquecimiento de datos que haya realizado en Amazon Redshift dentro de un lago de datos de Amazon S3 en un formato abierto. Puede entonces analizar sus datos con Redshift Spectrum y otros servicios de AWS como Amazon Athena, Amazon EMR y Amazon SageMaker.

Puede especificar una o más columnas de división para que los datos descargados se dividan automáticamente en carpetas dentro de su Amazon S3 bucket. Por ejemplo, puede elegir descargar sus datos de marketing y dividirlos en columnas por año, mes y días. Esto permite que sus consultas aprovechen la división y omitir el análisis de divisiones no relevantes, y así mejorar el desempeño de la consulta y minimizar los costos.

Para obtener más información, consulte la documentación de Amazon Redshift.

La exportación a lago de datos de Amazon Redshift es compatible con la versión 1.0.10480 o posteriores de Redshift. Consulte la tabla de la regiones de AWS para conocer la disponibilidad de Amazon Redshift.