Inserito il: Oct 16, 2018

Il catalogo dati di AWS Glue è un repository gestito di metadati che si integra con Amazon EMR, Amazon Athena, Amazon Redshift Spectrum e AWS Glue ETL. Il catalogo dati semplifica la gestione dei metadati e fornisce rilevamento automatico e storico delle versioni dello schema. Con Amazon EMR, è possibile utilizzare il catalogo dati come metastore predefinito per Spark, Presto e Hive invece di utilizzare un metastore Hive su cluster o con gestione automatica. Con il recente rilascio di policy basate su risorse e autorizzazioni a livello di risorsa per il catalogo dati, è possibile limitare o consentire l'accesso di EMR agli oggetti del catalogo, ad esempio database e tabelle. Le novità, inoltre, permettono ai cluster EMR in account differenti di accedere a un singolo catalogo dati. Le policy di Amazon S3 continuano a governare l'accesso ai dati memorizzati in Amazon S3, con le policy del catalogo dati ad aggiungere un ulteriore livello di protezione. Ulteriori informazioni