Publicado: Oct 16, 2018

O catálogo de dados do AWS Glue é um repositório de metadados integrado aos serviços Amazon EMR, Amazon Athena, Amazon Redshift Spectrum e ETL do AWS Glue. O catálogo de dados simplifica o gerenciamento de metadados e oferece descoberta automática e histórico de versões de esquemas. Com o Amazon EMR, você pode usar o catálogo de dados como metastore padrão para o Spark, o Presto e o Hive, em vez de usar um Hive Metastore no cluster ou autogerenciado. Com o lançamento recente de políticas e permissões com base em recursos para o catálogo de dados, você pode restringir ou permitir o acesso do EMR a objetos do catálogo, como bancos de dados e tabelas. A versão também permite que clusters do EMR em contas diferentes acessem um único catálogo de dados, habilitando o acesso entre contas. As políticas do Amazon S3 continuam a controlar o acesso aos dados armazenados no Amazon S3. As políticas do catálogo de dados adicionam uma outra camada de proteção. Saiba mais