Amazon EMR anuncia que S3A es el conector predeterminado
AWS anuncia S3A de Amazon EMR, un nuevo conector de Amazon S3 que optimiza el rendimiento de las cargas de trabajo de Apache Hadoop, Apache Spark y Apache Hive en Amazon EMR. Este nuevo conector mejora la arquitectura S3A de código abierto con optimizaciones específicas de AWS para ayudar a las organizaciones a procesar datos a gran escala de manera más eficiente. Con soporte de integración directa para S3 Express One Zone, S3 Glacier y AWS Outposts, el conector S3A de EMR ayuda a los clientes a aprovechar las diferentes opciones de almacenamiento en AWS para optimizar tanto la velocidad de acceso a los datos como el costo de almacenamiento en sus cargas de trabajo de EMR.
Además, el conector S3A de EMR ofrece características de seguridad avanzadas y capacidades de rendimiento que van más allá de S3A de código abierto. Entre las principales mejoras se incluyen el soporte de control de acceso detallado integrado en Apache Spark, la resolución mejorada de credenciales de S3A, MagicCommitter V2 para una escritura de archivos optimizada y la lista acelerada de prefijos de S3 para formatos de archivo en columnas. Estas mejoras están disponibles a partir de la versión 7.10 de EMR y mantienen la compatibilidad con las aplicaciones existentes.
El conector S3A de Amazon EMR está disponible en todas las regiones de AWS en las que Amazon EMR está disponible y viene preconfigurado con la versión 7.10 y posteriores de Amazon EMR. Para obtener más información sobre el conector S3A, consulte la documentación de Amazon EMR.