Amazon Athena para Apache Spark

Ejecute análisis interactivos en Apache Spark en menos de un segundo

¿Por qué elegir Athena en Apache Spark?

Comience con el análisis interactivo mediante Amazon Athena para Apache Spark en menos de un segundo para analizar petabytes de datos. Las aplicaciones interactivas de Spark se inician al instante y se ejecutan más rápido con el tiempo de ejecución optimizado para Spark, de modo que puede dedicar más tiempo a la información, en lugar de esperar a los resultados. Cree aplicaciones de Spark con la expresividad de Python a través de una experiencia de cuaderno simplificada en la consola de Athena o mediante las API de Athena. Con el modelo completamente administrado y sin servidor de Athena, no hay recursos que administrar, aprovisionar ni configurar, tampoco tarifas mínimas o costes de configuración. Solamente paga las consultas que ejecuta.

Beneficios

Dedique tiempo a la información y no a esperar resultados. Las aplicaciones interactivas de Spark se inician en menos de un segundo y se ejecutan más rápido con nuestro tiempo de ejecución optimizado para Spark.
Use la expresividad de Python con el popular marco de código abierto Spark para buscar información más compleja en sus datos. Use cuadernos para consultar datos, encadenar cálculos y ver resultados.
Ejecute aplicaciones de Spark de manera rentable, sin aprovisionar ni administrar recursos. Cree aplicaciones de Spark sin tener que preocuparse por las configuraciones de Spark ni las actualizaciones de versiones.
Trabaje con datos de distintos lagos de datos, en formatos de datos abiertos y con aplicaciones empresariales sin tener que desplazar los datos. Use datos detectados y clasificados por AWS Glue para crear la información de Spark.

Casos de uso

Use Athena y AWS Glue para explorar conjuntos de datos y trabajar con los datos. 

Consulte varios formatos y conjuntos de datos a la vez para formular información.

Cree aplicaciones SaaS que usen Athena para Apache Spark para trabajar con los datos de forma interactiva.

Explore almacenes de datos para generar conjuntos de datos de muestra y obtener una generación de características interactiva.