Amazon EMR 7.12 introduce il formato di tabella Apache Iceberg v3
Amazon EMR 7.12 è ora disponibile e introduce il nuovo formato di tabella Apache Iceberg v3, basato su Apache Iceberg 1.10. Questa versione consente di ottimizzare i costi legati all'eliminazione dei dati, migliorare governance e conformità grazie a un tracciamento più preciso delle modifiche a livello di riga e potenziare la sicurezza dei dati con un controllo di accesso più dettagliato.
Con Iceberg v3, l'eliminazione dei dati risulta più efficiente: le righe vengono contrassegnate come eliminate senza riscrivere interi file, velocizzando le pipeline di dati e riducendo i costi di archiviazione. La governance e la conformità risultano potenziate dal tracciamento automatico della creazione e modifica di ogni riga, creando gli audit trail necessari per i requisiti normativi e le attività di acquisizione dei dati di modifica. La crittografia a livello di tabella permette di migliorare la sicurezza dei dati, contribuendo a rispettare le normative sulla privacy relative ai dati più sensibili.
Grazie all'inclusione di Apache Spark 3.5.6, puoi utilizzare le funzionalità di Iceberg 1.10 per realizzare solide architetture di data lakehouse su Amazon S3. Questa versione introduce anche il supporto alle operazioni di governance dei dati sulle tabelle Iceberg attraverso AWS Lake Formation. Integra inoltre Apache Trino 476.
Amazon EMR 7.12 è disponibile in tutte le regioni AWS che supportano Amazon EMR. Per ulteriori informazioni su Amazon EMR 7.12, consulta la documentazione della versione di Amazon EMR 7.12.