Единая студия Amazon SageMaker теперь поддерживает ускоренный предварительный просмотр данных в Визуальном инструменте ETL
Единая студия Amazon SageMaker представляет предварительный просмотр данных версии 2.0 для Визуального инструмента ETL. Новый режим предварительного просмотра обеспечивает практически мгновенные результаты при создании и циклическом выполнении заданий ETL с помощью визуального интерфейса. Благодаря предварительному просмотру версии 2.0 инженеры данных и аналитики могут увидеть результаты каждого преобразования примерно в течение одной секунды, без необходимости запускать сеанс и без дополнительных затрат на вычислительные ресурсы.
Предварительный просмотр 2.0 использует встроенный в браузер движок запросов для локальной загрузки и обработки данных, устраняя зависимость операций предварительного просмотра от сеансов Spark на стороне сервера. Исходные данные извлекаются однократно и сохраняются в кэше браузера, поэтому последующие преобразования применяются мгновенно без повторных запросов к источнику данных. Пользователи Amazon Redshift могут выполнять итеративные преобразования без дополнительных запросов к своему кластеру Redshift, что позволяет ускорить процесс предварительного просмотра и сосредоточить ресурсы кластера на производственных рабочих нагрузках. Предварительный просмотр данных 2.0 поддерживает файлы CSV, Parquet и JSON из Amazon S3, а также данные из Amazon Redshift, таблиц Amazon S3, каталога данных AWS Glue и сторонних источников, включая Snowflake, MySQL, PostgreSQL, SQL Server, Oracle, Google BigQuery, Amazon DynamoDB и Amazon DocumentDB. В редакторе Визуального инструмента ETL в любое время доступно переключение между предварительным просмотром данных 2.0 и оригинальным предварительным просмотром на основе Spark.
Предварительный просмотр данных 2.0 в Визуальном инструменте ETL доступен во всех регионах AWS, где поддерживается Единая студия Amazon SageMaker. Дополнительные сведения см. в документации Единой студии Amazon SageMaker.