AWS Lake Formation estende le autorizzazioni delle tabelle per accedere ai dati sottostanti in Amazon S3
AWS Lake Formation consente ora la lettura e la scrittura dei file di dati sottostanti in Amazon S3 per le tabelle registrate nel catalogo dati AWS Glue. In questo modo è disponibile un unico set di autorizzazioni sia per le query SQL sia per l'accesso diretto ai file, utilizzando le concessioni sulle tabelle di Lake Formation esistenti.
Con questo rilascio, Lake Formation fornisce credenziali temporanee con ambito limitato per le posizioni S3 registrate, in base alle autorizzazioni delle tabelle. Le autorizzazioni SELECT concedono l'accesso in lettura, mentre le autorizzazioni SUPER concedono l'accesso in lettura e in scrittura ai dati in quella determinata posizione. Questa funzionalità è integrata in Amazon EMR 7.13 o versioni successive. Di conseguenza, è possibile accedere ai file di dati direttamente dai job Spark per attività che richiedono l'accesso a livello di file, quali l'addestramento dei modelli, l’ingegneria delle caratteristiche o il debug di problemi di qualità dei dati.
È inoltre possibile integrare le applicazioni Apache Spark o Trino utilizzando le API o tramite un plug-in open source fornito da AWS. Inoltre, ogni accesso viene registrato in AWS CloudTrail per fornire un audit trail unificato per le operazioni SQL e basate su file sulle tabelle.
Questa funzionalità è disponibile senza costi aggiuntivi in tutte le regioni AWS in cui è disponibile AWS Lake Formation. Per ulteriori informazioni, consulta la documentazione di Lake Formation, la documentazione di EMR, la guida di riferimento alle API e il plug-in open source.