投稿日: Jun 26, 2023
Amazon SageMaker Data Wrangler で、Snowflake に直接接続し、機械学習 (ML) 用にデータを準備したり特徴を作成したりできるようになりました。SageMaker Data Wrangler を使用すると、Amazon SageMaker Studio でのビジュアルインターフェイスを使用して機械学習 (ML) 用データを集約し準備する時間が、数週間から数分に短縮できます。
本日より、Amazon Simple Storage Service (Amazon S3) のストレージ統合を行ったり、S3 で耐久性のあるデータコピーを管理したりすることなく、SageMaker Data Wrangler から Snowflake に接続できるようになりました。この機能を使うことで、設定に要する時間が短縮され、SageMaker Data Wrangler と Snowflake との接続が簡素化されるため、組織全体の多数のユーザーへのスケールが簡単に行えるようになります。SageMaker Data Wrangler で、Snowflake のデータベース、表、スキーマ、クエリデータを参照したり、S3、Amazon Athena、Amazon Redshift、Amazon EMR、その他 50 以上の SaaS アプリケーションなど他の一般的なデータソースのデータと結合させて ML に適したデータセットを作成したりできます。その後、SageMaker Data Wrangler のビジュアルインターフェイスで、300 を超える組み込みの分析機能やデータ変換機能を使用して、データ品質の把握、データのクリーニング、特徴の作成をすばやく行うことができます。また、Amazon SageMaker Autopilot を使用してモデルのトレーニングやデプロイを行ったり、Amazon SageMaker Pipelines を使用して特徴量エンジニアリング、トレーニング、デプロイの各パイプラインのデータ作成プロセスを自動化したりできます。
SageMaker Data Wrangler は、現在 SageMaker Data Wrangler のサポート対象となっているすべてのリージョンにおいて Snowflake への直接接続を追加料金なしでサポートしています。詳細については、こちらのブログ記事および AWS テクニカルドキュメントを参照してください。