Perché AWS Glue?
La preparazione dei dati per ottenere risultati di qualità è il primo passaggio di un progetto di analisi o ML. AWS Glue è un servizio di integrazione dati serverless che facilita, velocizza e rende più economica la preparazione dei dati. Puoi scoprire e connetterti con oltre 70 diverse origini dei dati, gestire i dati in un catalogo centralizzato e creare, eseguire e monitorare visivamente le pipeline ETL per caricare i dati nei tuoi data lake.
Introduzione ad AWS Glue (01:54)

Come funziona

AWS Glue è un servizio di integrazione dei dati serverless che facilita la scoperta, la preparazione, lo spostamento e l'integrazione dei dati da più origini per l'analisi, il machine learning (ML) e lo sviluppo di applicazioni.

  • Opzioni del motore di integrazione dei dati
  • Scegli il motore di integrazione dei dati che preferisci in AWS Glue per supportare i tuoi utenti e carichi di lavoro.

    Il diagramma mostra diverse opzioni di motore di elaborazione dati per AWS Glue.
  • ETL basato su eventi
  • AWS Glue può eseguire i processi di estrazione, trasformazione e caricamento (ETL) non appena arrivano nuovi dati. Ad esempio, puoi configurare AWS Glue per eseguire il processo ETL non appena i nuovi dati diventano disponibili in Amazon Simple Storage Service (S3).

    Diagramma che mostra come AWS Glue può eseguire i processi ETL non appena arrivano nuovi dati.
  • Catalogo dati AWS Glue
  • Puoi utilizzare il catalogo dati per rilevare e rendere ricercabili diversi set di dati in AWS in modo rapido senza spostarli. Una volta catalogati, i dati sono immediatamente ricercabili e interrogabili con Amazon Athena, Amazon EMR e Amazon Redshift Spectrum.

    Diagramma che mostra il catalogo dati durante la scoperta e la ricerca di set di dati senza necessità di spostarli.
  • Processi ETL senza codice
  • AWS Glue Studio facilita la creazione, l'esecuzione e il monitoraggio visivi dei processi ETL di AWS Glue. Puoi creare processi ETL che spostano e trasformano i dati utilizzando un editor a trascinamento e rilascio e AWS Glue genererà automaticamente il codice.

    Diagramma che mostra come gli utenti possono generare processi ETL che spostano e trasformano i dati utilizzando un editor a trascinamento e rilascio.
  • Gestisci e monitora la qualità dei dati
  • Qualità dei dati di AWS Glue automatizza la creazione, la gestione e il monitoraggio delle regole di qualità dei dati per garantire l'alta qualità dei dati nei data lake e nelle pipeline di dati.

    Il diagramma mostra come Qualità dei dati di AWS Glue misura, monitora e gestisce automaticamente la qualità dei dati nei data lake e nelle pipeline di dati.
  • Preparazione dei dati
  • Con AWS Glue DataBrew è possibile esplorare e sperimentare con i dati direttamente da data lake, data warehouse e database, inclusi Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora e Amazon Relational Database Service (RDS). Puoi scegliere tra oltre 250 trasformazioni integrate in DataBrew per automatizzare le attività di preparazione dei dati, come filtro delle anomalie, standardizzazione dei formati e correzione dei valori non validi.

    Diagramma che mostra come DataBrew automatizza le attività di preparazione dei dati.

Novità

  • Data (dalla più alla meno recente)
Nessun risultato trovato
1

Scopri di più su AWS