Publicado en: Oct 11, 2018
Amazon Athena es un servicio de consultas interactivo que facilita el análisis de datos en Amazon S3 con SQL estándar. Athena es un servicio sin servidor, de manera que no es necesario administrar infraestructura y solo paga por las consultas que ejecuta. Hoy estamos presentando la posibilidad de crear tablas mediante el uso de los resultados de una consulta Select o la compatibilidad con el enunciado Create Table As Select (CTAS). Los analistas pueden usar enunciados CTAS para crear tablas nuevas a partir de tablas existentes en un subconjunto de datos o en un subconjunto de columnas, con la opción de convertir los datos en formatos de columnas, como Apache Parquet y Apache ORC, y particionarlo. Athena agrega automáticamente la tabla resultante y las particiones en el catálogo de datos de Glue, lo que permite que estén disponibles de manera inmediata para futuras consultas. De manera predeterminada, los enunciados CTAS en Athena graban datos en el formato Parquet. Otros formatos compatibles son Apache ORC, AVRO, JSON y Text, con la opción de usar Gzip o Snappy como formatos de compresión. También puede incluir datos en buckets por columnas u optar por cifrarlos.
Los enunciados CTAS ayudan a reducir los costos y a mejorar el rendimiento, ya que permiten a los usuarios ejecutar consultas en tablas de menor tamaño creadas a partir de tablas más grandes. Por ejemplo, puede usar un enunciado CTAS para crear una tabla que seleccione columnas específicas a partir de dos tablas diferentes que tengan datos en formato JSON, convertir los resultados en un formato en columnas, como Parquet, y agregar la tabla al catálogo de datos de Glue en un único enunciado. Mediante este proceso se logra que las futuras consultas sean más sencillas, ágiles y asequibles. Con los enunciados CTAS, los analistas ya no deben recurrir a los equipos de ingeniería de datos para crear tablas que se ajusten a sus cargas de trabajo específicas, lo que permite crear un entorno tipo autoservicio. Haga clic aquí para ver más ejemplos de enunciados CTAS. Los enunciados CTAS se cobran en función de los bytes escaneados en la fase Select, de manera similar al cobro de las consultas Select.