Amazon SageMaker Unified Studio の Visual ETL でより高速なデータプレビューが可能に

投稿日: 2026年3月9日

Amazon SageMaker Unified Studio に、Visual ETL 用のデータプレビュー v2.0 が導入されました。この新しいデータプレビューモードにより、Visual ETL ジョブの構築と反復処理の際に、ほぼ瞬時に結果を確認できるようになります。データプレビュー v2.0 を使用すると、データエンジニアとアナリストは各変換の出力を約 1 秒で確認できます。セッションの起動は不要、追加の計算コストもかかりません。

データプレビュー v2.0 では、ブラウザ内のクエリエンジンを使用してデータをローカルで読み込んで処理するため、プレビュー操作でサーバー側の Spark セッションに依存することがなくなります。一度取得されたソースデータはブラウザにキャッシュされるため、以降の変換は基になるデータソースを再クエリすることなく即座に適用されます。Amazon Redshift ユーザーは、Redshift クラスターに対して追加のクエリを行うことなく変換を繰り返し実行できるため、プレビューのワークフローを高速に保ち、クラスターリソースを本番ワークロードに集中させることができます。データプレビュー v2.0 では、Amazon S3 の CSV、Parquet、JSON ファイルのほか、Amazon Redshift、Amazon S3 Tables、AWS Glue データカタログ、サードパーティソース (Snowflake、MySQL、PostgreSQL、SQL Server、Oracle、Google BigQuery、Amazon DynamoDB、Amazon DocumentDB など) のデータもサポートされています。Visual ETL エディタのトグルを使用して、データプレビュー v2.0 と元の Spark ベースのプレビューをいつでも切り替えることができます。

Visual ETL のデータプレビュー v2.0 は、Amazon SageMaker Unified Studio がサポートされているすべての AWS リージョンでご利用いただけます。詳細については、Amazon SageMaker Unified Studio のドキュメントをご覧ください。