O Amazon Athena é um serviço de consultas interativas que facilita a análise de dados diretamente no Amazon S3 usando SQL padrão. Com alguns cliques no Console de gerenciamento da AWS, os clientes podem direcionar o Athena para seus dados armazenados no S3 e começar a usar SQL padrão para executar consultas ad-hoc e obter resultados em segundos. O Athena não tem servidor, portanto, não há infraestrutura para configurar ou gerenciar e os clientes pagam apenas pelas consultas executadas. É possível usar o Athena para processar logs, executar análise ad-hoc e executar consultas interativas. O Athena escala automaticamente, executando consultas em paralelo, por isso, os resultados são rápidos, mesmo ao trabalhar com grandes conjuntos de dados e consultas complexas. 

100x100_benefit_cloud

Como não tem servidor, o Amazon Athena não exige gerenciamento de infraestrutura. Não há preocupações com configuração, atualizações de software, falhas ou escalabilidade da infraestrutura conforme o crescimento de conjuntos de dados e número de usuários. O Athena administra automaticamente tudo sozinho, assim é possível manter o foco nos dados e não na infraestrutura.  

100x100_benefit_easy-setup

Para começar a usar, faça login no console do Athena, defina seu schema usando o assistente do console, ou digitando instruções DDL, e comece a consultar imediatamente usando o editor de consultas integrado. Também é possível usar o AWS Glue para fazer automaticamente crawling de fontes de dados para descobrir dados e preencher o Data Catalog com definições novas e modificadas de tabelas e partições. Os resultados são exibidos no console em segundos e gravados automaticamente em um local de sua escolha no S3. Também é possível fazer o download deles no desktop. Com o Athena, não há necessidade de trabalhos complexos de ETL para preparar dados para análise. Isso torna fácil para qualquer pessoa com habilidades em SQL analisar rapidamente conjuntos de dados em grande escala.  

100x100_benefit_check

O Amazon Athena usa o Presto, um mecanismo de consultas SQL distribuído e de código aberto otimizado para baixa latência e análise ad-hoc de dados. Isso significa que é possível executar consultas em grandes conjuntos de dados no Amazon S3 usando ANSI SQL, com compatibilidade total com grandes associações, funções de janela e matrizes. O Athena é compatível com uma grande variedade de formatos de dados, como CSV, JSON, ORC, Avro ou Parquet. Também é possível conectar-se ao Athena por meio de várias ferramentas de BI usando o driver JDBC do Athena.

100x100_benefit_pay-as-you-go

Com o Amazon Athena, apenas as consultas executadas são cobradas. As cobranças são feitas de acordo com a quantidade de dados verificados por cada consulta. É possível obter economias de custos significativas e aumento de desempenho ao compactar, particionar ou converter dados em um formato colunar, pois cada uma dessas operações reduz a quantidade de dados que o Athena precisa para verificar e executar uma consulta.

100x100_benefit_performance

Com o Amazon Athena, não é necessário preocupar-se com gerenciar ou ajustar clusters para obter um desempenho mais rápido. O Athena é otimizado para desempenho rápido com o Amazon S3. O Athena executa automaticamente consultas em paralelo para que os resultados da consulta sejam obtidos em segundos, mesmo em grandes conjuntos de dados.

100x100_benefit_available

O Amazon Athena é altamente disponível e executa consultas usando recursos de computação em várias instalações, roteando automaticamente consultas de modo correto, caso uma instalação específica esteja inacessível. O Athena usa o Amazon S3 como datastore subjacente, conferindo alta disponibilidade e durabilidade aos seus dados. O Amazon S3 proporciona infraestrutura durável para armazenar dados importantes e foi projetado para oferecer durabilidade de objetos de 99,999999999%. Seus dados são armazenados com redundância em várias instalações e diversos dispositivos em cada instalação.

100x100_benefit_secure

O Amazon Athena permite controlar o acesso a dados usando políticas do AWS Identity and Access Management (IAM), listas de controle de acesso (ACLs) e políticas de bucket do Amazon S3. Com as políticas do IAM, é possível conceder aos usuários do IAM um controle minucioso aos buckets do S3. Ao controlar o acesso aos dados no S3, você pode restringir quais usuários podem fazer queries usando o Athena. O Athena também facilita a consulta de dados criptografados que se encontram armazenados no Amazon S3 e a gravação dos resultados criptografados de volta em seu bucket do S3. Tanto a criptografia no servidor quanto no cliente são compatíveis.

100x100_benefit_ingergration

O Amazon Athena apresenta integração de fábrica ao AWS Glue. Com o Glue Data Catalog, você poderá criar um repositório de metadados unificado entre vários serviços, fazer crawling de fontes de dados para descobrir schemas e preencher o Catalog com definições novas e modificadas de tabelas e partições, além de manter o versionamento do schema. Você também pode usar os recursos ETL totalmente gerenciados do Glue para transformar dados ou convertê-los em formatos colunares para otimizar a performance de consultas e reduzir os custos. Saiba mais sobre o AWS Glue.