AWS Glue を使用すると、クローラ (データの検出) と ETL ジョブ (データの処理とロード) に対して時間あたりの料金が秒単位で課金されます。AWS Glue Data Catalog の場合、メタデータの保存とアクセスに対して単純に月額料金のみがかかります。最初の 100 万個のオブジェクトの保存と最初の 100 万回のアクセスは無料です。ETL コードをインタラクティブに開発するために開発エンドポイントをプロビジョニングする場合は、時間あたりの料金がかかり、秒単位で課金されます。

ETL ジョブと開発エンドポイント

データカタログの保存と要求

クローラ

料金の例

すぐに ETL を開始できますか?

AWS Glue の使用を開始する

AWS Glue を使用すると、ETL ジョブの実行に費やした時間に対してだけ支払うことができます。管理するリソースがなく、初期費用も不要で、スタートアップ時間やシャットダウン時間も課金されません。ETL ジョブの実行に使用された DPU (Data Processing Unit) の数に基づいて時間あたりの課金が発生します。1 つの DPU (Data Processing Unit) では 4 つの vCPU と 16 GB のメモリが提供されます。Glue の ETL ジョブには最低で 2 個の DPU が必要です。AWS Glue のデフォルトでは、各 ETL ジョブに 10 個の DPU が割り当てられます。DPU 時間あたり 0.44 ドルが 1 秒単位で課金され、最も近い秒単位に切り上げられます。ETL ジョブごとに 10 分の最小期間が設定されます。

開発エンドポイントはオプションで、ETL コードをインタラクティブに開発することを選択した場合にのみ課金が適用されます。開発エンドポイントは、開発エンドポイントのプロビジョニングに使用されたデータ処理ユニットの時間に基づいて課金されます。Glue の開発エンドポイントには最低で 2 個の DPU が必要です。AWS Glue のデフォルトでは、各開発エンドポイントに 5 個の DPU が割り当てられます。DPU 時間あたり 0.44 ドルが 1 秒単位で課金され、最も近い秒単位に切り上げられます。プロビジョニングされた開発エンドポイントごとに 10 分の最小期間が設定されます。

AWS Glue が使用可能な全 AWS リージョン:

  • DPU 時間あたり 0.44 ドルが 1 秒単位で課金され、ETL ジョブごとに最低 10 分
  • DPU 時間あたり 0.44 ドルが 1 秒単位で課金され、プロビジョニングされた開発エンドポイントごとに最低 10 分

Amazon S3、Amazon RDS、Amazon Redshift などのデータソースからの ETL データの場合は、標準のリクエストおよびデータ転送料金が請求されます。Amazon CloudWatch を使用する場合、CloudWatch ログおよび CloudWatch イベントの標準料金が請求されます。

AWS Glue Data Catalog を使用すると、最大 100 万個のオブジェクトを無料で保存できます。保存したオブジェクトの数が 100 万個を超えた場合、100 万個を超えた 100,000 個のオブジェクトごとに月に 1 ドルが請求されます。AWS Glue Data Catalog のオブジェクトは、テーブル、テーブルバージョン、パーティション、またはデータベースです。

AWS Glue Data Catalog への最初の 100 万回のアクセスリクエストは毎月無料です。1 か月で 100 万回を超えるリクエストがあった場合、最初の 100 万回を超えた 100 万回のリクエストごとに 1 ドルが請求されます。一般的なリクエストとしては、CreateTable、CreatePartition、GetTable、および GetPartitions があります。AWS Glue Data Catalog でサポートされているリクエストの完全なリストについては、こちらのドキュメントを参照してください。

AWS Glue が使用可能な全 AWS リージョン:

ストレージ:

  • 最初の 100 万個のオブジェクトの保存は無料
  • 100 万個を超えて保存された場合、100,000 個のオブジェクトごとに毎月 1 ドル

リクエスト:

  • 最初の 100 万回のリクエストは毎月無料
  • 100 万回を超えた場合は 100 万回のリクエストごとに毎月 1 ドル

AWS Glue クローラランタイムがデータを検出し、AWS Glue Data Catalog にデータを取り込む場合は、時間単位の料金がかかります。クローラの実行に使用された DPU (Data Processing Unit) の数に基づいて時間あたりの課金が発生します。1 つの DPU (Data Processing Unit) では 4 つの vCPU と 16 GB のメモリが提供されます。1 秒単位で課金され、最も近い秒単位に切り上げられます。クローラごとに 10 分の最小期間が設定されます。AWS Glue クローラの使用はオプションで、API を介して AWS Glue Data Catalog にデータを直接取り込むことができます。

AWS Glue が使用可能な全 AWS リージョン:

  • DPU 時間 あたり 0.44 ドルが 1 秒単位で課金され、クローラの実行ごとに最低 10 分

ETL ジョブの例: 10 分間実行して 6 DPU を消費する ETL ジョブについて考えてみましょう。1 DPU 時間の価格は 0.44 ドルです。ジョブは 6 分の 1 時間稼働して 6 DPU を消費したため、DPU 時間あたり 0.44 ドルで 6 DPU * 1/6 時間、つまり 0.44 ドルが請求されます。

開発エンドポイントの例: 次に、ETL コードをインタラクティブに開発するために、ノートブックを接続するための開発エンドポイントをプロビジョニングすることについて考えてみましょう。開発エンドポイントのプロビジョニング時には、5 個の DPU が割り当てられます。開発エンドポイントを 24 分つまり 2/5 時間稼働させると、DPU 時間あたり 0.44 ドルで 5 DPU * 2/5 時間、つまり 0.88 ドル が請求されます。

AWS Glue Data Catalog の無料利用枠の例: ある月に AWS Glue Data Catalog に 100 万個のテーブルを保存し、これらのテーブルにアクセスするために 100 万回のリクエストを実行する場合を考えてみましょう。この使用は AWS Glue Data Catalog の無料利用枠の対象となるため、支払いは 0 ドルです。最初の 100 万個のオブジェクトの保存と毎月 100 万回のリクエストを無料で行うことができます。

AWS Glue Data Catalog の例: では、ストレージ使用量は月あたり 100 万テーブルのままですが、リクエストが倍増して月に 200 万回になった場合を考えてみましょう。例えば、クローラを使用して新しいテーブルを検索し、30 分間実行して 2 DPU を消費するとします。

最初の 100 万個のテーブルの保存が無料であるため、ストレージコストは 0 ドルのままです。最初の 100 万回のリクエストも無料です。無料利用枠を超える 100 万回のリクエストに対して 1 ドルが課金されます。クローラは DPU 時間あたり 0.44 ドル課金されるため、DPU 時間あたり 0.44 ドルで 2 DPU * 1/2 時間分を支払うことになり、月額料金は合計 1.44 ドルです。