投稿日: Mar 20, 2023

Amazon EMR で Graviton3 ベースのインスタンスがサポートされるようになりました。Amazon EC2 C7G インスタンスを EC2 と Amazon EKS の EMR で使用できるようになりました。AWS Graviton3 プロセッサは、AWS Graviton プロセッサファミリーの最新版です。コンピューティングパフォーマンスと浮動小数点パフォーマンスが向上します。また、DDR5 メモリに対応しているため、DDR4 と比べてメモリ帯域幅が 50% 増えます。Amazon EMR は Amazon Elastic Compute Cloud C7g (Graviton3) インスタンスのサポートを開始します。これにより、Apache Spark ワークロードのコストパフォーマンスが最大 13% 向上します。Graviton3 ベースのインスタンスに移行することで、EKS 上の EMR で実行されている Spark ワークロードのコストパフォーマンスを最大 15% 向上させることができます。 この記事でコストパフォーマンスの改善を実現するために使用したベンチマークは、業界標準の TPC-DS ベンチマークから導き出されたもので、Spark SQL Performance Tests GitHubリポジトリからのクエリを使用して以下の修正を適用しています。ワークロードのパフォーマンスはさまざまであるため、同様のコスト削減効果が得られるわけではありません。

さらに、以下のサポートが EMR に追加されました。

  1. Amazon EMR は Amazon EC2 C6i、M6i、i4i、R6i、R6i、R6iD インスタンスのサポートを開始します。これにより、Apache Spark ワークロードのコストパフォーマンスが 6% から 33% 向上します
  2. Amazon EMR は Amazon EC2、M6a、C6a インスタンスのサポートを開始します。これにより、Apache Spark ワークロードのコストパフォーマンスが 15% から 50% 向上します
  3. 最大 30 TB の NVMe SSD インスタンスストレージ (lm4gn、ls4gen) を備えたストレージ最適化インスタンス
  4. 最大 1,952 GiB の DRAM ベースのインスタンスメモリ (X1) を備えたメモリ最適化インスタンス
  5. メモリ最適化インスタンスおよび汎用インスタンス (r5n、M5、m5dn、r5ad、および m5ad)。

サポートされている AWS リージョンと Amazon EMR のリリースについては、ドキュメントをご覧ください。価格設定の詳細については、料金設定ページをご覧ください。