- Amazon SageMaker›
- Elaborazione dei dati di Amazon SageMaker›
- Domande frequenti
Domande frequenti sull'elaborazione dei dati di Amazon SageMaker
Domande generali
Cos'è Amazon SageMaker Data Processing?
SageMaker Data Processing analizza, prepara, integra e orchestra i dati con le funzionalità di elaborazione di Amazon Athena, Amazon EMR, AWS Glue e Flusso di lavoro gestito da Amazon per Apache Airflow (MWAA). Puoi utilizzare framework di elaborazione dati open source come Apache Spark, analizzare dati su larga scala con Trino e creare facilmente analisi in tempo reale con Apache Flink e Apache Spark.
Quali servizi sono inclusi in SageMaker Data Processing?
SageMaker Data Processing riunisce Amazon EMR, Athena, AWS Glue e Amazon MWAA.
Perché dovrei usare SageMaker Data Processing?
SageMaker Data Processing ti aiuta a esplorare i dati, creare relativi processi di trasformazione, orchestrare e implementare pipeline di dati su larga scala. Migliora le prestazioni, ottenendo approfondimenti più rapidi rispetto ai tradizionali sistemi open source con versioni convenienti e compatibili grazie alle API open source di Apache Spark, Apache Airflow, Apache Flink, Trino e altre. SageMaker Data Processing fornisce l'accesso alle origini dati in Amazon SageMaker Lakehouse tramite integrazioni Zero-ETL, funzionalità di query federate e connettori.
Migrazione e accesso
Devo eseguire la migrazione a SageMaker per utilizzare servizi esistenti come Amazon EMR, Athena o AWS Glue?
No, non è necessario eseguire la migrazione a SageMaker. Puoi continuare a utilizzare Amazon EMR, Athena, AWS Glue e Amazon MWAA come fai oggi. Tuttavia, ti consigliamo di iniziare a usare SageMaker per sfruttare strumenti unificati, governance dei dati integrata e architetture SageMaker Lakehouse semplificate.
Cosa succede ai processi, alle query, al codice e alle risorse che ho già creato o che intendo creare in Amazon EMR, Athena o AWS Glue?
Non è presente alcun impatto sul codice, sulle query, sui processi e sulle altre risorse che hai creato e utilizzato con Amazon EMR, Athena o AWS Glue. Se preferisci, puoi continuare a utilizzare questi servizi per nuovi carichi di lavoro. Le risorse create in questi servizi, come Amazon EMR su cluster Amazon Elastic Compute Cloud (Amazon EC2), sono visibili in SageMaker per semplificare lo sviluppo di applicazioni di analisi e IA. Le esperienze di sviluppo integrate esistenti in Amazon EMR, AWS Glue e Athena continueranno a esserci oltre a una nuova esperienza di sviluppo all'interno di SageMaker.
Quale versione di AWS Glue è disponibile in SageMaker?
La versione più recente di AWS Glue, AWS Glue 5.0, è disponibile in SageMaker. AWS Glue 5.0 accelera i carichi di lavoro di elaborazione dei dati e offre il runtime più recente Apache Spark 3.5.2 ottimizzato per le prestazioni, in modo da poter sviluppare, eseguire e scalare per approfondimenti più rapidi. Per ulteriori informazioni, visita la pagina di AWS Glue.
Prezzi
Qual è il modello di prezzi per SageMaker Data Processing?
Ogni servizio AWS utilizzato tramite SageMaker è soggetto a prezzi individuali. Per maggiori dettagli, consulta la pagina dei prezzi di AWS per Athena, Amazon EMR, AWS Glue e Amazon MWAA.