Publicado: Oct 11, 2018

O Amazon Athena é um serviço de consultas interativas que facilita a análise de dados no Amazon S3 usando SQL padrão. O Athena não tem servidor, portanto, não há infraestrutura para gerenciar e você paga apenas pelas consultas executadas. Hoje, estamos lançando o suporte à criação de tabelas usando o resultado de uma consulta com Select, ou seja, o suporte à instrução Create Table As Select (CTAS). Os analistas podem usar instruções CTAS para criar novas tabelas a partir de tabelas ou subconjuntos de dados ou colunas existentes, com opções para converter os dados em formatos colunares (Apache Parquet e Apache ORC) e particioná-los. O Athena adiciona automaticamente a tabela e as partições resultantes ao catálogo de dados do Glue, onde são disponibilizados imediatamente para consultas subsequentes. Por padrão, as instruções CTAS no Athena gravam dados no formato Parquet. Outros formatos compatíveis incluem Apache ORC, AVRO, JSON e texto, com opções para o uso de Gzip ou Snappy como formatos de compressão. Você também pode organizar os dados em buckets por colunas ou optar por criptografá-los.

As instruções CTAS ajudam a reduzir o custo e aumentar a performance, permitindo que usuários executem consultas em tabelas menores, criadas a partir de tabelas maiores. Por exemplo, você pode usar uma instrução CTAS para criar uma tabela que seleciona colunas específicas de duas tabelas diferentes que têm dados no formato JSON, converter os resultados em um formato colunar com o Parquet e adicionar a tabela ao catálogo de dados do Glue em uma única instrução. Dessa forma, as consultas subsequentes ficam mais fáceis, ágeis e econômicas. As instruções CTAS possibilitam um ambiente de autoatendimento. Os analistas não precisam mais depender de equipes de engenharia de dados para criar tabelas adequadas para cargas de trabalho específicas. Clique aqui para ver exemplos adicionais de instruções CTAS. As instruções CTAS são cobradas de acordo com os bytes pesquisados na fase do Select, de forma similar à cobrança das consultas com Select do Athena.