Publicado en: Oct 16, 2018

El catálogo de datos de AWS Glue es un repositorio de metadatos administrado que está integrado con Amazon EMR, Amazon Athena, Amazon Redshift Spectrum y AWS Glue ETL. El catálogo de datos simplifica la administración de metadatos y ofrece historial de versiones de esquemas y detección automática de esquemas. Con Amazon EMR, puede usar el catálogo de datos como almacén de metadatos predeterminado para Spark, Presto y Hive en vez de usar un Hive Metastore autoadministrado o en clúster. Mediante el reciente lanzamiento de las políticas basadas en recursos y los permisos a nivel de recursos para el catálogo de datos, puede restringir o permitir el acceso de EMR a objetos del catálogo, como bases de datos y tablas. El lanzamiento también permite que clústeres de EMR de diferentes cuentas obtengan acceso a un único catálogo de datos, lo que posibilita el acceso entre cuentas. Las políticas de Amazon S3 continúan controlando el acceso a los datos almacenados en Amazon S3, con políticas de catálogo de datos que agregan otra capa de protección. Más información