Amazon Web Services ブログ

Category: Amazon SageMaker Unified Studio

Amazon SageMaker ワークフローによるスケーラブルなエンドツーエンド ETL パイプラインのオーケストレーション

本記事では、Amazon SageMaker Unified Studio ワークフローでコードベースのエンドツーエンド ETL パイプラインを構築・管理する方法を紹介します。AWS Glue、Amazon EMR Serverless、Amazon Redshift Serverless、Amazon MWAA を組み合わせ、EC の顧客行動分析を例に、データ取り込みから変換、品質チェック、データウェアハウスへのロード、日次スケジュール実行まで、単一の統合 UI で構築する手順を解説します。

Amazon SageMaker のカスタムサブスクリプションワークフローによるデータガバナンスの加速

本記事では、Amazon SageMaker のサブスクリプションリクエスト承認を自動化するカスタムワークフローを紹介します。AWS Lambda、Amazon EventBridge、Amazon SNS を組み合わせたイベント駆動型のサーバーレスアーキテクチャにより、ガバナンスを維持しつつ機微でないデータセットへのアクセスを迅速化できます。

Amazon SageMaker Catalog を利用するガバナンスチーム向けメール通知の自動化

Amazon SageMaker Catalog で発生するイベントを中央ガバナンスチームに自動通知する仕組みを、Amazon EventBridge、AWS Lambda、Amazon SNS、Amazon SQS を組み合わせて構築する方法を紹介します。プロジェクト作成や資産公開といった重要なイベントをリアルタイムで捕捉し、メールアラートとして届けることで、組織のガバナンス標準をスケールしながら維持できます。

Amazon SageMaker を使用したレイクハウスのアーキテクチャ選択ガイド

Amazon SageMaker のレイクハウスアーキテクチャにおけるストレージパターンの選択ガイドです。データレイク (汎用 S3、S3 Tables) とデータウェアハウス (Redshift Managed Storage) の特性を比較し、ETL、Zero-ETL、データフェデレーションなどのデータ取り込みパターンとともに、ユースケースに応じた最適なアーキテクチャの選択方法を解説します。

アプリケーションを変更せずに Amazon SageMaker Catalog でデータメッシュパターンを実装する

Amazon SageMaker Catalog を使用してデータメッシュパターンを実装する方法を説明します。既存のアプリケーションやデータリポジトリを変更せずに、Amazon SageMaker Unified Studio でデータをオンボード、公開、サブスクライブする手順を紹介します。

Amazon SageMaker Unified Studio の Identity Center (IDC) ベースドメインと IAM ベースドメインを併用する

Amazon SageMaker Unified Studio で、IDC ベースドメインと IAM ベースドメインの 2 種類のドメイン構成が利用可能になりました。本記事では、IAM ロールの再利用と属性ベースのアクセス制御 (ABAC) を使って、IDC ベースドメインの既存のガバナンスフレームワークを維持しながら、IAM ベースドメインの最新開発ツールを活用する方法を紹介します。