投稿日: Apr 3, 2023
SageMaker Canvas では、Amazon Athena や Snowflake、Salesforce、SAP OData などのサードパーティ SaaS アプリケーションなど、ノーコード ML に使用できる 45 以上データソースがサポートされるようになりました。Canvas は、ML の経験を必要とせず、コードを 1 行も記述しなくても、アナリストがポイントアンドクリックで ML の予測を生成できるインターフェイスです。
データインジェストは、問題を正確にモデル化するためにアルゴリズムに高品質のデータを供給するための ML の中核となるステップです。SaaS アプリケーションの普及により、システム全体にデータが分散し、データ収集が複雑で時間がかかるようになりました。以前は、お客様が希望する SaaS アプリケーションからデータを取得して、サポートされている Canvas ソース (Amazon S3、Amazon Redshift、Snowflake、またはローカルディスク) に転送して、ノーコード ML に使用する必要がありました。このプロセスは手作業であるため、機械学習の過程で貴重なデータが取り残されることがよくあります。
Canvas では、45 以上のソースからのデータインジェストがサポートされるようになったことで、お客様はさまざまなソースに保存されているデータを活用できるようになりました。AWS は、お客様が S3 などの AWS サービスにデータを安全に転送できるようにするサービス、Amazon AppFlow と提携しました。転送が完了すると、Canvas 内のデータにアクセスして、テーブルを参照したり、ソース間でデータテーブルを結合したり、データをプレビューしたり、適切なデータをインポートするための Athena クエリを作成したりできます。データのインポート後は、ML モデルの構築、説明可能性データの表示、予測の生成など、既存の Canvas 機能をすべて活用できます。
この機能のサポートは、Canvas が利用可能なすべての AWS リージョンで利用できるようになりました。これら 45 以上のソースからのデータのインポートを開始するには、Canvas のドキュメントに従ってください。