Publicado en: Nov 22, 2022
Amazon EMR sin servidor presenta la compatibilidad con la lectura y escritura de datos en Amazon DynamoDB con sus flujos de trabajo de Spark y Hive. Ahora, puede exportar, importar, consultar y unir tablas de Amazon DynamoDB directamente desde sus aplicaciones Spark o Hive de EMR sin servidor. Amazon DynamoDB es una base datos NoSQL completamente administrada que cumple con los requisitos de latencia y rendimiento de las aplicaciones de alta demanda, ya que proporciona una latencia de milisegundos de un solo dígito y un perfecto rendimiento predecible con escalabilidad de almacenamiento.
Los usuarios de AWS suelen tener la necesidad de procesar datos almacenados en Amazon DynamoDB de manera eficiente y a escala para el análisis descendente. El equipo de Amazon EMR desarrolló emr-dynamodb-connector de código abierto para ayudar a los clientes a simplificar el acceso y la configuración de Amazon DynamoDB utilizando sus aplicaciones Apache Spark y Apache Hive. Este conector permite varios casos de uso de análisis, incluidos el procesamiento eficiente de datos en Amazon DynamoDB y la unión de tablas de Amazon DynamoDB con tablas externas de Amazon S3, Amazon RDS u otros almacenes de datos a los que pueda acceder Amazon EMR sin servidor. Con Amazon EMR versión 6.9, puede obtener todos los beneficios del conector de Amazon DynamoDB con sus aplicaciones de Amazon EMR sin servidor. Puede utilizar las tablas de Amazon DynamoDB con acceso entre cuentas o entre regiones.
También nos complace anunciar que EMR sin servidor admite el acceso a buckets específicos de Amazon S3 desde otras cuentas de AWS para procesar datos de las aplicaciones Spark y Hive. Los clientes de AWS utilizan varias cuentas de AWS para separar mejor los diferentes proyectos o líneas de negocio. La posibilidad de contar con funciones entre cuentas simplifica la protección y la administración de los lagos de datos distribuidos en varias cuentas a través de un enfoque centralizado. Con el acceso entre cuentas de Amazon S3, puede utilizar su aplicación Spark o Hive de EMR sin servidor en una cuenta de AWS y tener acceso a los datos almacenados en buckets específicos de otras cuentas de AWS para su procesamiento.
Estas características ahora están disponibles en todas las regiones de EMR sin servidor. Para obtener más información, consulte la documentación de Amazon EMR sin servidor.