投稿日: Jun 1, 2022
Amazon EMR の新しいサーバーレスデプロイオプションである Amazon EMR Serverlessが一般提供されたことをお知らせします。これにより、データエンジニアやアナリストは、ペタバイト規模のデータ分析をクラウド上で簡単かつ低コストで実行できるようになります。Amazon EMR は、Apache Spark、Apache Hive、Presto などのオープンソース解析フレームワークをベースにした、大規模な分散データ処理ジョブ、インタラクティブ SQL クエリ、機械学習 (ML) アプリケーションを実行できるビッグデータソリューションです。EMR Serverlessでは、クラスターを構成、最適化、チューニング、管理することなく Spark および Hive のアプリケーションを実行することができます。
EMR Serverlessは、きめ細かい自動スケーリングを提供し、アプリケーションが必要とするコンピューティングとメモリのリソースをプロビジョニングして迅速にスケーリングします。例えば、Spark のジョブで、最初の 5 分間は 2 個、次の 10 分間は 10 個、最後の 20 分間は 5 個のエグゼキューターが必要な場合、EMR Serverless は必要に応じて自動的にリソースを提供し、ユーザーは使用したリソース分だけ料金を支払えばいいのです。また、EMR Serverless は、パフォーマンスに最適化された EMR ランタイムを搭載しているため、ジョブを高速で実行することができます。さらに、EMR Serverless は EMR Studio と統合されており、実行中のジョブのステータス確認、ジョブ履歴の確認、使い慣れたオープンソースツールを使用してジョブのデバッグなどの包括的なツールを提供します。
Amazon EMR Serverlessは通常、次の 4 つのリージョンで利用できます:米国東部 (バージニア北部)、米国西部 (オレゴン)、アジアパシフィック (東京)、欧州 (アイルランド)。
EMR Serverlessのブログ記事はこちら、詳細は EMR Serverlessのドキュメントをご参照ください。