Data Lineage è ora disponibile al pubblico in Amazon DataZone e Amazon SageMaker di nuova generazione.

Inserito il: 3 dic 2024

AWS rende disponibile al pubblico la funzionalità Data Lineage in Amazon DataZone e Amazon SageMaker di nuova generazione, una funzionalità che acquisisce automaticamente lineage da AWS Glue e Amazon Redshift per visualizzare gli eventi di lineage dall'origine al consumo. Essendo compatibile con OpenLineage, questa funzionalità consente ai produttori di dati di aumentare il lineage automatico con eventi di lineage acquisiti da sistemi abilitati a OpenLineage o tramite API, per fornire una visione completa dello spostamento dei dati ai consumatori di dati.

La funzionalità automatizza l'acquisizione del lineage di schemi e trasformazioni di asset e colonne di dati dalle esecuzioni di AWS Glue, Amazon Redshift e Spark agli strumenti per mantenere la coerenza e ridurre gli errori. Grazie all'automazione integrata, gli amministratori di domini e i produttori di dati possono automatizzare l'acquisizione e l'archiviazione degli eventi di lineage quando i dati sono configurati per la condivisione nel catalogo dei dati aziendali. I consumatori di dati possono accrescere la fiducia nell'origine di un asset grazie alla visione complessiva del suo lineage. Invece, i produttori di dati possono valutare l'impatto delle modifiche apportate a un asset ottenendo maggiori dettagli sul suo consumo. Inoltre, la funzionalità Data Lineage ad ogni evento crea versioni del lineage, consentendo agli utenti di visualizzare quest'ultimo in qualsiasi momento o di confrontare le trasformazioni avvenute nella cronologia di un asset o di un processo. La cronologia della derivazione permette di comprendere più a fondo l'evoluzione dei dati, elemento essenziale per la risoluzione dei problemi, l'audit e la convalida dell'integrità degli asset di dati.

La funzionalità Data Lineage è disponibile al pubblico in tutte le regioni AWS in cui sono offerti Amazon DataZone e Amazon SageMaker di nuova generazione.

Per maggiori informazioni vai alla pagina di Amazon DataZone e di Amazon SageMaker di nuova generazione.