投稿日: Jan 22, 2019

AWS Glue で Python スクリプトを使用して、しばしば ETL (抽出、変換、読み込み) ワークフローの一部となる、中小規模の一般的なタスクを実行できるようになりました。以前の AWS Glue ジョブは、サーバーレスの Apache Spark 環境で実行されるジョブに限定されていました。Amazon Redshift、Amazon Athena、Amazon EMR などのサービスに SQL クエリを送信したり、機械学習および化学分析を実行するなどの Python シェルジョブを使用できるようになりました。

AWS Glue の Python シェルジョブは、Python 2.7 と互換性があり、Boto3、NumPy、SciPy、pandas などのライブラリがあらかじめロードされているスクリプトをサポートします。1 DPU (Data Processing Unit) または 0.0625 DPU (1/16 DPU) を使用して Python シェルジョブを実行できます。1 つの DPU で 4 vCPU のコンピューティングと 16GB のメモリで構成される処理能力を提供します。

AWS Glue での Python シェルジョブの料金について詳しくは、AWS の料金ページをご覧ください。AWS Glue で Python シェルジョブを定義する方法について詳しくは、AWS のドキュメントをご覧ください。

AWS Glue を利用できるリージョンについては、AWS リージョンテーブルをご覧ください。