Amazon SageMaker が、ビジュアル ETL 変換と S3 Tables のサポートを追加

投稿日: 2025年5月6日

Amazon SageMaker が、次の 14 種類の新しいビルトインビジュアル ETL 変換を提供するようになりました。"Format timestamp" (タイムスタンプのフォーマット)、"Split string" (文字列の分割)、"Regex extractor" (正規表現による抽出)、"Autobalance processing" (オートバランス処理)、"UUID" (ユニバーサル一意識別子)、"Identifier" (識別子)、"Unpivot columns into rows" (列を行にピボット解除)、"Pivot rows into columns" (行を列にピボット)、"Parse JSON column" (JSON 列の解析)、"Extract JSON path" (JSON パスの抽出)、"Lookup" (検索)、"Conditional router" (条件付きルーター)、"Route group" (グループのルーティング)、"Order by" (並べ替え)。これらの変換を使用することで、ETL デベロッパーは一般的な変換タスクのためにカスタムコードを記述しなくても、高度なデータパイプラインを迅速に構築できます。また、Amazon S3 Tables は Amazon SageMaker Lakehouse ノードを通してサポートされるようになりました。S3 Tables 全体のデータにインプレースで柔軟にアクセスし、プレビューできます。

Amazon SageMaker のビジュアル ETL は、ETL フローを構築し、Amazon Q Developer でフローをオーサリングするためのドラッグアンドドロップインターフェイスを提供します。新しいビジュアル ETL 変換はそれぞれ、固有のデータ処理ニーズに対応します。例えば、"Identifier" を使用してデータセットの各行に数値識別子を割り当てたり、JSON 文字列をデータ構造体または配列に変換できる "Parse JSON column" で JSON 文字列を変換したり、"Extract JSON path" 変換で必要な JSON パスのみを抽出したりできます。

これらのビジュアル ETL 変換は、Amazon SageMaker が利用可能なすべての AWS リージョンで利用できます。最新の提供情報については、サポートしているリージョンの一覧を参照してください。

詳細については、Amazon SageMaker ドキュメントをご覧ください。