投稿日: Mar 22, 2023

Amazon SageMaker Data Wrangler は、機械学習 (ML) のために Snowflake のデータにアクセスするときに、Okta、Microsoft Azure AD、Ping Federate などの ID プロバイダーによる OAuth ベースの認証をサポートするようになりました。Data Wrangler を使用すると、Amazon SageMaker Studio でのビジュアルインターフェイスを使用して機械学習 (ML) 用データを集約し準備する時間が、数週間から数分に短縮できます。

今回のローンチにより、Snowflake を含むすべてのアプリケーションのユーザー、グループ、アクセス制御を、単一の ID プロバイダーを使用して管理することが可能になります。管理者が Data Wrangler の Snowflake OAuth アクセスを設定すると、Data Wrangler から Snowflake に接続するときに組織の ID プロバイダーを使用してログインし、ML のデータを取り込むことができます。Amazon S3、Amazon Athena、Amazon Redshift、Amazon EMR などの一般的なデータソースと、Data Wrangler がサポートする 40 以上の SaaS アプリケーションのデータを結合して、ML に適したデータセットを作成できます。Data Wrangler のビジュアルインターフェイスで、300 を超える組み込みの分析機能やデータ変換機能を使用して、データ品質の把握、データのクリーニング、特徴量の作成をすばやく行うことができます。また、SageMaker Autopilot を使用してモデルの学習やデプロイを行い、SageMaker Pipeline との統合を使用して特徴量エンジニアリング、学習、パイプラインのデータ準備プロセスを運用可能にする作業も、すべて Data Wrangler から行うことが可能です。 

現在 Data Wrangler のサポート対象となっているすべてのリージョンにおいて、追加料金なしで、Snowflake 接続に Okta、Microsoft Azure AD、および Ping Federate を使用できます。詳細については、こちらのブログ記事および AWS テクニカルドキュメントを参照してください。