Publicado en: Nov 28, 2023
Ahora puede acelerar el procesamiento y el análisis de datos hasta 4 veces más con las aplicaciones de Apache Spark que con los datos de S3 Standard usando Amazon EMR y la clase de almacenamiento de Amazon S3 Express One Zone. S3 Express One Zone es una clase de almacenamiento de zona de disponibilidad única y alto rendimiento diseñada específicamente para ofrecer un acceso coherente a los datos con una latencia inferior a 9,99 milisegundos para las aplicaciones sensibles a la latencia y los datos a los que se accede con más frecuencia.
Amazon EMR es la solución de macrodatos en la nube, líder del sector, para el procesamiento de datos, el análisis interactivo y el uso de machine learning en marcos de código abierto optimizados para la escala de petabytes en AWS. Si tiene cargas de trabajo críticas para el rendimiento con acuerdos de nivel de servicio (SLA), como los requisitos de tiempo de finalización de trabajos para las actualizaciones de lagos de datos, o necesita un tiempo de respuesta rápido para los informes del panel de BI, utilice S3 Express One Zone cuando ejecute aplicaciones de EMR Spark en un clúster de EC2.
S3 Express One Zone está disponible con la versión 6.15.0 de Amazon EMR en las regiones de AWS en las que está disponible S3 Express One Zone. Para empezar, traslade sus datos al almacenamiento de S3 Express One Zone y use el conector S3a en su código de Spark para leer y escribir datos. S3a es el conector que utiliza EMR para procesar objetos de S3 y es un requisito con los buckets de S3 Express One Zone. Para obtener más información, consulte Uso de EMR con datos en S3 Express One Zone en la documentación de Amazon EMR.