Perché AWS Glue?
La preparazione dei dati per ottenere risultati di qualità è il primo passaggio di un progetto di analisi o ML. AWS Glue è un servizio di integrazione dati serverless che facilita, velocizza e rende più economica la preparazione dei dati. Puoi scoprire e connetterti con oltre 70 diverse origini dei dati, gestire i dati in un catalogo centralizzato e creare, eseguire e monitorare visivamente le pipeline ETL per caricare i dati nei tuoi data lake.
Introduzione ad AWS Glue (01:54)

Vantaggi di AWS Glue

Supporto flessibile per ETL, ELT, batch, streaming e molto altro, senza vincoli
Capacità in scala petabyte e fatturazione con pagamento in base al consumo per qualsiasi dimensione di dati
Supporta tutti gli utenti di dati, dagli sviluppatori agli utenti aziendali
Funzionalità complete di integrazione di dati in un unico servizio serverless

Come funziona

AWS Glue è un servizio di integrazione dei dati serverless che facilita la scoperta, la preparazione, lo spostamento e l'integrazione dei dati da più origini per l'analisi, il machine learning (ML) e lo sviluppo di applicazioni.

  • Opzioni del motore di integrazione dei dati
  • Scegli il motore di integrazione dei dati che preferisci in AWS Glue per supportare i tuoi utenti e carichi di lavoro.

    Il diagramma mostra diverse opzioni di motore di elaborazione dati per AWS Glue.
  • ETL basato su eventi
  • AWS Glue può eseguire i processi di estrazione, trasformazione e caricamento (ETL) non appena arrivano nuovi dati. Ad esempio, puoi configurare AWS Glue per eseguire il processo ETL non appena i nuovi dati diventano disponibili in Amazon Simple Storage Service (S3).

    Diagramma che mostra come AWS Glue può eseguire i processi ETL non appena arrivano nuovi dati.
  • Catalogo dati AWS Glue
  • Puoi utilizzare il catalogo dati per rilevare e rendere ricercabili diversi set di dati in AWS in modo rapido senza spostarli. Una volta catalogati, i dati sono immediatamente ricercabili e interrogabili con Amazon Athena, Amazon EMR e Amazon Redshift Spectrum.

    Diagramma che mostra il catalogo dati durante la scoperta e la ricerca di set di dati senza necessità di spostarli.
  • Processi ETL senza codice
  • AWS Glue Studio facilita la creazione, l'esecuzione e il monitoraggio visivi dei processi ETL di AWS Glue. Puoi creare processi ETL che spostano e trasformano i dati utilizzando un editor a trascinamento e rilascio e AWS Glue genererà automaticamente il codice.

    Diagramma che mostra come gli utenti possono generare processi ETL che spostano e trasformano i dati utilizzando un editor a trascinamento e rilascio.
  • Gestisci e monitora la qualità dei dati
  • Qualità dei dati di AWS Glue automatizza la creazione, la gestione e il monitoraggio delle regole di qualità dei dati per garantire l'alta qualità dei dati nei data lake e nelle pipeline di dati.

    Il diagramma mostra come Qualità dei dati di AWS Glue misura, monitora e gestisce automaticamente la qualità dei dati nei data lake e nelle pipeline di dati.
  • Preparazione dei dati
  • Con AWS Glue DataBrew è possibile esplorare e sperimentare con i dati direttamente da data lake, data warehouse e database, inclusi Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora e Amazon Relational Database Service (RDS). È possibile scegliere tra oltre 250 trasformazioni integrate in DataBrew per automatizzare le attività di preparazione dei dati, come filtro delle anomalie, standardizzazione dei formati e correzione dei valori non validi.

    In aggiunta, AWS Glue Studio è uno strumento di preparazione dati utilizzabile per preparare i dati con un'interfaccia grafica interattiva point-and-click senza bisogno di scrivere codice.

    Diagramma che mostra come DataBrew automatizza le attività di preparazione dei dati per gli utenti.

Casi d'uso

Esplora, sperimenta ed elabora i dati in modo interattivo

Utilizzando le sessioni interattive di AWS Glue, i data engineer possono esplorare e preparare i dati in modo interattivo utilizzando l'ambiente di sviluppo integrato (IDE) o il notebook di loro scelta.

Semplifica lo sviluppo della pipeline ETL

Rimuovi la gestione dell'infrastruttura con il provisioning automatico e la gestione dei lavoratori e consolida tutte le tue esigenze di integrazione dei dati in un unico servizio.

Supporta vari framework di elaborazione e carichi di lavoro

Supporta più facilmente vari framework di elaborazione dati, come ETL ed ELT, e vari carichi di lavoro, inclusi batch, micro-batch e streaming.

Scopri i dati in modo efficiente

Identifica rapidamente i dati su AWS, on-premise e altri cloud, quindi rendili immediatamente disponibili per l'interrogazione e la trasformazione.

Novità

  • Data (dalla più alla meno recente)
Nessun risultato trovato
1

Scopri di più su AWS