SageMaker Canvas を使用してノーコードの ML とデータ準備をペタバイト規模で実現できます
Amazon SageMaker Canvas は、ペタバイト規模のデータセットをサポートできるようにすることで、企業がデータの可能性を最大限に活用できるようにします。本日より、大規模なデータセットをインタラクティブに準備し、エンドツーエンドのデータフローを作成し、ペタバイト単位での AutoML 実験をトリガーできるようになり、以前の 5 GB の制限から大幅に増加しました。50 以上のコネクター、直感的な「データとのチャット」インターフェイス、ペタバイトのサポートにより、Canvas は、実世界の企業ユースケースに対応する、スケーラブルでローコード/ノーコードの ML ソリューションを提供します。
本日より、Canvas はランダムや層化などの新しいサンプリング手法を活用して、最大 20 万行 (10 倍に増加) のサンプリングが可能になりました。これにより、EMR Serverless との新しいシームレスな統合を活用して、データセット全体を処理する前に、データの品質に関する洞察を収集し、データ変換の影響をインタラクティブに把握することが容易になります。Canvas は、サンプリング、準備、モデル構築、推論に至るまで、5 GB を超えるデータの処理を自動的に EMR Serverless にスケーリングし、直感的なエクスペリエンスを通じてデータの予測能力を最大限に引き出します。EMR Serverless の使用には、追加の EMR 料金のコストが発生します。
新しいペタバイトのサポートと改善されたインタラクティブエクスペリエンスは、SageMaker Canvas が提供されているすべての AWS リージョンで利用できます。
ノーコード ML と大規模データセットのデータ準備を始めるには、当社の技術ドキュメントを使用して Canvas ドメインとユーザープロファイルで「大規模データ処理設定」を有効にし、AWS 機械学習のブログで新機能の使い方を学んでください。既存のユーザーは、ドキュメントごとに SageMaker ドメインの設定を更新し、Canvas ワークスペースからログアウトし、再度ログインして、最新バージョンにアクセスする必要があります。