Publicado en: Nov 26, 2019
Amazon Athena ahora permite a los usuarios ejecutar consultas SQL en datos almacenados en orígenes de datos relacionales, no relacionales, personalizados y de objetos. Con las consultas federadas, los clientes pueden enviar una sola consulta SQL que examina los datos de varios orígenes alojados en la nube o que se ejecutan en las instalaciones.
Ejecutar un análisis sobre datos distribuidos entre las aplicaciones puede convertirse en una tarea compleja y que demanda mucho tiempo. Los datos necesarios para un análisis suelen distribuirse entre almacenes de datos relacionales, en memoria, de clave-valor, de documentos, de búsqueda, de gráficos, de objetos, de series temporales y de libro mayor. A la hora de analizar los datos en estos orígenes, los analistas crean canalizaciones complejas para realizar extracciones, transformaciones y cargas en un almacén de datos a fin de que los datos puedan consultarse. Acceder a los datos desde varios orígenes requiere aprender nuevos lenguajes de programación y constructos de acceso a los datos. Las consultas SQL federadas en Athena eliminan esta complejidad, ya que permiten a los usuarios consultar los datos de forma local independientemente de su ubicación. Los analistas pueden utilizar constructos de SQL conocidos para UNIR datos de varios orígenes con el objetivo de realizar un análisis rápido y almacenar los resultados en Amazon S3 para su posterior uso.
Athena ejecuta consultas federadas mediante conectores de orígenes de datos de Athena que se ejecutan en AWS Lambda. AWS tiene conectores de orígenes de datos de código abierto para Amazon DynamoDB, Apache HBase, Amazon DocumentDB, Amazon Redshift, AWS CloudWatch, las métricas de AWS CloudWatch y las bases de datos relacionales que cumplen los requisitos de JDBC, como MySQL y PostgreSQL con la licencia Apache 2.0. Los clientes pueden utilizar estos conectores para ejecutar consultas SQL federadas en Athena, entre estos orígenes de datos. Además, mediante el uso de Athena Query Federation SDK, los desarrolladores pueden crear conectores a cualquier origen de datos para permitir que Athena ejecute consultas SQL en ese origen de datos. Athena Query Federation Connector extiende los beneficios de las consultas federadas más allá de los conectores provistos por AWS. Gracias a que los conectores se ejecutan en AWS Lambda, los clientes no tienen que administrar infraestructura ni planificar el escalado para satisfacer los picos de demanda.
La consulta federada de Athena está disponible en modo de vista previa en la región us-east-1 (Norte de Virginia). Comience a utilizar la versión preliminar ahora mismo siguiendo estos pasos.
Para obtener más información sobre esta característica, consulte la documentación aquí.
Para comenzar a utilizar un conector existente, siga esta guía.
Para aprender a crear su propio conector de origen de datos con Athena Query Federation SDK, consulte este enlace.