投稿日: Oct 5, 2018

Amazon SageMaker ノートブックを AWS Glue コンソールから作成して、これを AWS Glue 開発エンドポイントに接続できるようになりました。この統合により、Amazon SageMaker の完全マネージドノートブックを、自分自身でノートブックサーバーをプロビジョニング、管理する代わりに使い、AWS Glue ETL スクリプトの開発をより簡単で早くできるようになりました。AWS Glue 開発エンドポイントはサーバーレス Apache Spark 環境で、これを用いて AWS Glue ETL スクリプトを対話的に開発、デバッグ、テストできます。詳細については、AWS のドキュメントをご覧ください。

さらに、Amazon SageMaker Spark ライブラリを AWS Glue 開発エンドポイントに使えます。このライブラリは、Amazon SageMaker 用のオープンソースの Apache Spark ライブラリーです。これを使用して Apache Spark ステージや Apache Spark ML パイプライン内で Amazon SageMaker とやり取りをするステージをインターリーブし、Amazon SageMaker で Apache Spark DataFrames を使用するモデルを、K-Means クラスタリングや XGBoost など Amazon が提供する ML アルゴリズムを使用してトレーニングできます。

この機能は、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、欧州 (フランクフルト)、欧州 (アイルランド)、アジアパシフィック (ソウル)、アジアパシフィック (シドニー)、アジアパシフィック (東京) の各 AWS リージョンで使用できます。AWS Glue を利用できるリージョンについては、AWS リージョンテーブルをご覧ください。