Amazon SageMaker Unified Studio ora supporta l'anteprima rapida dei dati in ETL visivo
Amazon SageMaker Unified Studio introduce l'anteprima dei dati v2.0 per ETL visivo, una nuova modalità di anteprima dei dati che fornisce risultati pressoché istantanei durante la creazione e l'iterazione di processi ETL visivi. Con l'anteprima dei dati v2.0, i data engineer e gli analisti possono visualizzare l'output di ogni trasformazione in circa un secondo, senza necessità di avviare una sessione e senza costi di calcolo aggiuntivi.
L'anteprima dei dati v2.0 utilizza un motore di query integrato nel browser per caricare e elaborare i dati localmente, eliminando la dipendenza dalle sessioni Spark lato server per le operazioni di anteprima. I dati di origine vengono recuperati una sola volta e memorizzati nella cache del browser; pertanto, le trasformazioni successive vengono applicate istantaneamente senza dover eseguire nuovamente query sulla sorgente dati sottostante. Per gli utenti di Amazon Redshift, ciò consente di iterare sulle trasformazioni senza query aggiuntive sul cluster Redshift, mantenendo rapido il flusso di lavoro di anteprima e concentrando le risorse del cluster sui carichi di lavoro di produzione. L'anteprima dei dati v2.0 supporta file CSV, Parquet e JSON da Amazon S3, oltre ai dati provenienti da Amazon Redshift, Amazon S3 Tables, AWS Glue Data Catalog e fonti di terze parti tra cui Snowflake, MySQL, PostgreSQL, SQL Server, Oracle, Google BigQuery, Amazon DynamoDB e Amazon DocumentDB. Un selettore nell'editor ETL visivo offre l'opzione di passare in qualsiasi momento dall'anteprima dei dati v2.0 a quella originale basata su Spark.
L'anteprima dei dati v2.0 in ETL visivo è disponibile in tutte le regioni AWS in cui Amazon SageMaker Unified Studio è supportato. Per ulteriori informazioni, consulta la documentazione di Amazon SageMaker Unified Studio.