Publicado en: Jan 20, 2022
Anunciamos la compatibilidad de Apache Spark SQL para actualizar las tablas de Glue Data Catalog cuando se utiliza la integración de Amazon EMR con AWS Lake Formation.
La integración de Amazon EMR con AWS Lake Formation le permite definir y aplicar permisos a nivel de base de datos, de tabla y de columna cuando los usuarios de Apache Spark acceden a datos en Amazon S3 mediante el catálogo Glue Data Catalog. Anteriormente, cuando la integración con AWS Lake Formation estaba habilitada, solo podía leer datos mediante declaraciones de Spark SQL como, por ejemplo, SHOW DATABASES y DESCRIBE TABLE (Mostrar bases de datos y Describir tabla). Ahora, puede introducir datos en las tablas de Glue Data Catalog o actualizarlas mediante las siguientes declaraciones: INSERT INTO (Insertar en), INSERT OVERWRITE (Insertar sobreescritura) y ALTER TABLE (Modificar tabla).
Esta característica se encuentra habilitada en Amazon EMR 5.34 en las siguientes regiones de AWS: EE. UU. Este (Norte de Virginia), EE. UU. Este (Ohio), EE. UU. Oeste (Norte de California), EE. UU. Oeste (Oregón), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (París), Europa (Estocolmo), Canadá (centro), Asia-Pacífico (Bombay), Asia-Pacífico (Seúl), Asia-Pacífico (Singapur), Asia-Pacífico (Tokio), Asia-Pacífico (Sídney) y América del Sur (São Paulo).
Para comenzar, consulte Integración de Amazon EMR con AWS Lake Formation.