Amazon Athena es un servicio de consultas interactivo que facilita el análisis de datos directamente en Simple Storage Service (Amazon S3) con SQL estándar. Con tan solo unos clics en la consola de administración de AWS, los clientes pueden apuntar Athena a sus datos almacenados en S3 y comenzar a usar SQL estándar para ejecutar consultas interactivas y obtener resultados en cuestión de segundos. Athena no tiene servidor, por lo que no es necesario configurar ni administrar infraestructura, y los clientes solo pagan por las consultas que ejecutan. Puede utilizar Athena para procesar registros, analizar datos y ejecutar consultas interactivas. Athena se escala automáticamente (ejecuta las consultas en paralelo), por lo que los resultados se obtienen rápidamente, incluso con conjuntos de datos de gran tamaño y consultas complejas.
Sin servidor. Sin infraestructura. Sin administración.
Amazon Athena es un servicio sin servidor, por lo que no hay que administrar infraestructura. No es necesario preocuparse por configuraciones, actualizaciones del software, errores ni del escalado de la infraestructura cuando crezcan sus conjuntos de datos y cantidad de usuarios. Athena se ocupa de todo esto automáticamente, para que pueda concentrarse en los datos y no en la infraestructura.
Fácil de comenzar
Para comenzar, inicie sesión en la consola de Athena, defina los esquemas con el asistente de la consola o mediante la introducción de declaraciones DDL y comience a realizar consultas inmediatamente con el editor de consultas integrado. También puede usar AWS Glue para rastrear automáticamente orígenes de datos con el fin de encontrar datos y completar su catálogo de datos con definiciones de particiones y tablas nuevas y modificadas. Los resultados se muestran en la consola en cuestión de segundos y se escriben automáticamente en la ubicación que elija de S3. También puede descargarlos en su escritorio. Con Athena, no es necesario realizar trabajos complejos de ETL con el fin de preparar los datos para realizar análisis. Por ello, cualquier persona con conocimientos en SQL puede analizar conjuntos de datos a gran escala de forma rápida y sencilla.
Consultas sencillas con SQL estándar
Amazon Athena utiliza Presto, un motor de consultas SQL distribuidas de código abierto optimizado para el análisis de datos interactivo con baja latencia. Eso significa que puede hacer consultas en conjuntos de datos de gran tamaño en Simple Storage Service (Amazon S3) con ANSI SQL, con compatibilidad para combinaciones grandes, funciones de ventanas y matrices. Athena admite una amplia variedad de formatos de datos, como CSV, JSON, ORC, Avro o Parquet. Con los conectores federados de origen de datos de Athena, puede consultar almacenes de datos adicionales y combinar los datos con datos almacenados en Simple Storage Service (Amazon S3). Puede acceder a Athena y ejecutar consultas desde la consola de Athena, la API, la CLI, el SDK de AWS y la inteligencia empresarial admitida y las aplicaciones de desarrollo de SQL mediante los controladores JDBC y ODBC de Athena.
Pago por consulta
Con Amazon Athena, solo paga por las consultas que ejecuta. Se le cobra en función del volumen de datos escaneados por cada consulta. Puede lograr mejoras importantes en el rendimiento y el ahorro de costos al comprimir, dividir en particiones o convertir sus datos en un formato de columna, ya que cada una de esas operaciones reduce el volumen de datos que Athena debe escanear para ejecutar una consulta.
Rendimiento ágil
Con Amazon Athena, no tiene que preocuparse por administrar o ajustar clústeres para obtener un rendimiento ágil. Athena está optimizado para lograr un rendimiento ágil con Amazon S3. Athena ejecuta las consultas en paralelo automáticamente, de manera que obtenga los resultados en cuestión de segundos, incluso en conjuntos de datos de gran tamaño.
Alta disponibilidad y durabilidad
Amazon Athena tiene alta disponibilidad y ejecuta consultas con recursos informáticos en varias ubicaciones, lo que le permite direccionar las consultas automáticamente según corresponda si una ubicación en particular no se encuentra disponible. Athena utiliza Amazon S3 como almacenamiento de datos subyacente, por lo que los datos son duraderos y están altamente disponibles. Amazon S3 ofrece una infraestructura duradera que permite almacenar datos importantes y está diseñado para ofrecer una durabilidad del 99,999999999% de los objetos. Sus datos se almacenan de forma redundante en diversas instalaciones y en diferentes dispositivos de cada instalación.
Seguridad
Amazon Athena le permite controlar el acceso a los datos mediante políticas de AWS Identity and Access Management (IAM), listas de control del acceso (ACL) y políticas de buckets de Amazon S3. Con las políticas de IAM, puede otorgar a los usuarios de IAM un control minucioso de sus buckets de S3. Al controlar el acceso a los datos de S3, puede impedir que los usuarios realicen consultas en ellos con Athena. Athena también le permite consultar datos cifrados almacenados en Amazon S3 y escribir los resultados cifrados nuevamente en su bucket de S3. Se admiten ambos cifrados, del lado del servidor y del lado del cliente.
Integración
Amazon Athena se integra directamente con AWS Glue. Con el catálogo de datos de AWS Glue, podrá crear un repositorio de metadatos unificado en diversos servicios, rastrear orígenes de datos para descubrir esquemas y completar su catálogo con definiciones de particiones y tablas nuevas y modificadas, y mantener las versiones de los esquemas. También puede usar las capacidades ETL totalmente administradas de Glue para transformar datos o convertirlos en formatos de columna con el fin de reducir los costos y optimizar el rendimiento de las consultas. Más información sobre AWS Glue.
Consulta federada
Athena proporciona conectores para orígenes de datos empresariales como Amazon DynamoDB, Amazon Redshift, Amazon OpenSearch, MySQL, PostgreSQL, Redis y otros almacenes de datos de terceros conocidos. Con los conectores de datos de Athena, puede generar información a partir de varios orígenes de datos mediante la sintaxis SQL de Athena fácil de usar y sin tener que mover los datos con scripts ETL. Los conectores de datos se ejecutan como funciones de AWS Lambda y puede habilitarse para el acceso entre cuentas, lo que le permite escalar las consultas SQL a cientos de usuarios finales. Para obtener una lista de los orígenes compatibles, consulte “Uso de conectores de orígenes de datos de Athena”. Para aprender a crear un conector de orígenes de datos personalizado, consulte “SDK del conector de Athena”.
Machine learning
Es posible invocar modelos de Machine Learning de SageMaker en una consulta SQL de Athena para ejecutar tareas de inferencia. La posibilidad de utilizar modelos de aprendizaje automático en consultas SQL permite que tareas complejas, como la detección de anomalías, el análisis de cohortes de clientes y las predicciones de ventas, sean tan simples como escribir una consulta SQL. Athena facilita a cualquier persona con experiencia en SQL la ejecución de modelos de aprendizaje automático implementados en Amazon SageMaker.

Explore todas las opciones de precios que se ofrecen con Amazon Athena.

Obtenga acceso instantáneo a la capa gratuita de AWS.

Comience a crear con Amazon Athena en la consola de administración de AWS.