Publicado en: Nov 13, 2020

Las consultas federadas en Amazon Athena permiten a los usuarios ejecutar consultas SQL en datos almacenados en orígenes de datos relacionales, no relacionales, personalizados y de objetos. La característica, que por lo general está disponible en las regiones us-east-1, us-west-2 y us-east-2, permite a los clientes enviar una solicitud SQL sencilla que escanea datos de diversos orígenes que se ejecutan en las instalaciones o que están alojadas en la nube.  

Ejecutar un análisis sobre datos distribuidos entre las aplicaciones puede convertirse en una tarea compleja y que demanda mucho tiempo. Los datos necesarios para un análisis suelen distribuirse entre almacenes de datos relacionales, en memoria, de clave-valor, de documentos, de búsqueda, de gráficos, de objetos, de series temporales y de libro mayor. A la hora de analizar los datos en estos orígenes para luego poder consultarlos, los analistas crean canalizaciones complejas para realizar extracciones, transformaciones y cargas en un almacén de datos. Acceder a los datos desde varios orígenes requiere aprender nuevos lenguajes de programación y constructos de acceso a los datos. Las consultas SQL federadas en Athena eliminan esta complejidad, ya que permiten a los usuarios consultar los datos de forma local independientemente de su ubicación. Los analistas pueden utilizar constructos de SQL conocidos para UNIR datos de varios orígenes con el objetivo de realizar un análisis rápido y almacenar los resultados en Amazon S3 para su posterior uso. 

Athena realiza consultas federadas mediante conectores de orígenes de datos de Athena que se ejecutan en AWS Lambda. AWS tiene conectores de orígenes de datos de código abierto para Amazon DynamoDB, Apache HBase, Amazon Document DB, Amazon Redshift, AWS CloudWatch, las métricas de AWS CloudWatch y las bases de datos relacionales que cumplen los requisitos de JDBC, como MySQL y PostgreSQL con la licencia Apache 2.0. Los clientes pueden utilizar estos conectores para ejecutar consultas SQL federadas en Athena, entre estos orígenes de datos. Además, mediante el uso de Athena Query Federation SDK, los desarrolladores pueden crear conectores a cualquier origen de datos para permitir que Athena ejecute consultas SQL en ese origen de datos. Athena Query Federation Connector extiende los beneficios de las consultas federadas más allá de los conectores provistos por AWS. Gracias a que los conectores se ejecutan en AWS Lambda, los clientes no tienen que administrar infraestructura ni planificar el escalado para satisfacer los picos de demanda.

Con esta versión, la consulta federada de Athena por lo general está disponible en las regiones us-east-1, us-west-2 y us-east-2. 

Para obtener más información sobre esta característica, consulte la documentación aquí.
Para comenzar a utilizar un conector existente, siga esta guía.
Para aprender a crear su propio conector de origen de datos con Athena Query Federation SDK, consulte este enlace.