Com o Amazon Athena, apenas as consultas executadas são cobradas. As cobranças são feitas de acordo com a quantidade de dados verificados por cada consulta. É possível obter economias de custos significativas e aumento de desempenho ao compactar, particionar ou converter dados em um formato colunar, pois cada uma dessas operações reduz a quantidade de dados que o Athena precisa para verificar e executar uma consulta.

O Amazon Athena já está disponível

Conheça o Amazon Athena
  • 5 USD por TB de dados verificados.  

É possível economizar de 30% a 90% nos custos por consulta e obter melhor desempenho ao compactar, particionar e converter dados nos formatos colunares.

A cobrança será feita por número de bytes verificados pelo Amazon Athena, arredondada para cima para o megabyte mais próximo, com um mínimo de 10 MB por consulta. Não há cobranças para instruções Data Definition Language (DDL), como CREATE/ALTER/DROP TABLE, instruções de gerenciamento de partições ou consultas com falha. As consultas canceladas são cobradas com base na quantidade de dados verificados.

A compactação dos dados permite que o Athena verifique menos dados. A conversão de dados em formatos colunares permite que o Athena leia de modo seletivo apenas as colunas exigidas para processar os dados. O Athena é compatível com Apache ORC e Apache Parquet. O particionamento dos dados permite que o Athena limite a quantidade de dados verificados. Isso resulta em economias de custos e melhor desempenho. É possível ver a quantidade de dados verificados por consulta no console do Athena. Para obter detalhes, consulte o exemplo de definição de preço do Athena.

O Amazon Athena consulta dados diretamente no Amazon S3. Não há cobranças adicionais de armazenamento pela consulta de dados no Athena. As cobranças serão feitas de acordo com as taxas padrão de armazenamento, solicitações e transferência de dados do S3. Como padrão, os resultados de consulta são armazenados em um bucket do S3 de sua escolha e também são cobrados de acordo com as taxas padrão do Amazon S3.

Se você usar o catálogo de dados do AWS Glue com o Athena, serão cobradas as taxas padrão do catálogo de dados do AWS Glue Data. Para obter mais detalhes, clique aqui.

Considere uma tabela com três colunas de mesmo tamanho, armazenadas como um arquivo de texto não compactado com um total de 3 TB no Amazon S3. A execução de uma consulta para obter dados de uma única coluna da tabela exige que o Amazon Athena verifique o arquivo inteiro, pois os formatos de texto não podem ser divididos.

  • Essa consulta custaria: 15 USD. (Preço por 3 TB verificados = 3 x 5 USD/TB = 15 USD)

Caso o arquivo seja compactado usando o GZIP, será possível verificar ganhos de compactação na razão 3:1. Neste caso, o arquivo compactado teria um tamanho de 1 TB. A mesma consulta nesse arquivo custaria 5 USD. O Athena precisa verificar o arquivo inteiro novamente, mas como ele tem um tamanho três vezes menor, o valor cobrado será um terço a menos que o pago anteriormente.

Se o arquivo for compactado e também convertido para um formato colunar, como o Apache Parquet, ao atingir a compactação 3:1, você ainda obterá 1 TB de dados no Amazon S3. Mas, neste caso, como o Parquet é colunar, o Amazon Athena só poderá ler a coluna que for relevante para a consulta que está sendo executada. Como a consulta em questão é referente apenas a um única coluna, o Athena só lê essa coluna e pode evitar a leitura de dois terços do arquivo. Como o Athena só lê um terço do arquivo, ele verifica apenas 0,33 TB de dados do S3.

  • Essa consulta custaria: 1,67 USD. Existe uma economia 3 vezes maior na compactação e na leitura de uma única coluna.
    (Tamanho do arquivo = 3 TB/3 = 1 TB. Os dados verificados durante a leitura de uma única coluna = 1 TB/3 = 0,33 TB. Preço de 0,33 TB = 0,33 x 5 USD/TB = 1,67 USD)