Publicado en: Mar 14, 2023

Amazon EMR se complace en presentar una nueva función que permite a los usuarios aplicar permisos a nivel de tablas y columnas basados en AWS Lake Formation en el lago de datos de Amazon S3 para operaciones de escritura (es decir, INSERT INTO, INSERT OVERWRITE) con trabajos de Apache Hive enviados mediante la API Steps de Amazon EMR. Esta característica permite a los administradores de datos definir y aplicar una seguridad detallada a nivel de tablas y columnas para que los clientes accedan a los datos a través de Apache Hive, que se ejecuta en Amazon EMR.

La integración de Amazon EMR con AWS Lake Formation le permite definir y aplicar los permisos a nivel de bases de datos, tablas y columnas con motores de procesamiento de datos de código abierto, como Apache Spark y Apache Hive, que se ejecutan en Amazon EMR. Antes de esta versión, los administradores de datos podían definir y hacer cumplir los permisos basados en Lake Formation en bases de datos, tablas y columnas para cargas de trabajo de solo lectura con Apache Hive en EMR. Con la versión actual, ahora puede usar Hive para escribir o modificar tablas habilitadas para Lake Formation. Esto significa que puede aplicar los permisos a nivel de base de datos, tablas y columnas basados en Lake Formation cuando sus clientes ejecuten las consultas INSERT INTO, INSERT OVERWRITE y ALTER TABLE. Para usar los permisos basados en Lake Formation, los clientes deben usar Glue Data Catalog como metaalmacén.

Esta característica está disponible con la versión 6.10 de Amazon EMR para Amazon EMR en los clústeres de EC2 de todas las regiones en las que está disponible Amazon EMR. Para empezar, consulte la sección Integración de Amazon EMR con AWS Lake Formation en la documentación de Amazon EMR.