Amazon SageMaker Unified Studio unterstützt jetzt eine schnellere Datenvorschau in Visual ETL
Amazon SageMaker Unified Studio führt die Datenvorschau v2.0 für Visual ETL ein, einen neuen Datenvorschaumodus, der nahezu sofortige Ergebnisse liefert, wenn Visual-ETL-Jobs erstellt und iteriert werden. Mit Datenvorschau v2.0 können Dateningenieure und Analysten die Ergebnisse jeder Transformation in etwa einer Sekunde sehen, ohne dass eine Sitzung gestartet werden muss und ohne dass zusätzliche Rechenkosten anfallen.
Die Datenvorschau v2.0 verwendet eine In-Browser-Abfrage-Engine, um Daten lokal zu laden und zu verarbeiten, wodurch die Abhängigkeit von serverseitigen Spark-Sitzungen für Vorschauvorgänge beseitigt wird. Quelldaten werden einmal abgerufen und im Browser zwischengespeichert, sodass nachfolgende Transformationen sofort angewendet werden, ohne die zugrunde liegende Datenquelle erneut abzufragen. Für Amazon-Redshift-Benutzer bedeutet dies, dass Sie die Transformationen ohne zusätzliche Abfragen für Ihr Redshift-Cluster iterieren können. So bleibt Ihr Vorschau-Workflow schnell und Ihre Cluster-Ressourcen können sich auf Produktionsworkloads konzentrieren. Datenvorschau v2.0 unterstützt CSV-, Parquet- und JSON-Dateien von Amazon S3 sowie Daten aus Amazon Redshift, Amazon S3 Tables, AWS-Glue-Datenkatalog und Drittanbieterquellen wie Snowflake, MySQL, PostgreSQL, SQL Server, Oracle, Google BigQuery, Amazon DynamoDB und Amazon DocumentDB. Ein Schalter im Visual-ETL-Editor gibt Ihnen die Möglichkeit, jederzeit zwischen der Datenvorschau v2.0 und der ursprünglichen Spark-basierten Vorschau zu wechseln.
Die Datenvorschau v2.0 in Visual ETL ist in allen AWS-Regionen verfügbar, in denen Amazon SageMaker Unified Studio unterstützt wird. Weitere Informationen finden Sie in der Dokumentation zu Amazon SageMaker Unified Studio.