投稿日: Jun 7, 2022
Amazon EMR リリース 6.6 は、Apache Spark 3.2、Apache Spark RAPIDS 22.02、CUDA 11、Apache Hudi 0.10.1、Apache Iceberg 0.13、Trino 0.367、および PrestoDB 0.267 をサポートするようになりました。EMR on EC2、EKS、および最近リリースされた EMR Serverless で、パフォーマンス最適化バージョンの Apache Spark 3.2 を利用できます。さらに、Apache Hudi 0.10.1 および Apache Iceberg 0.13 は、EC2、EKS、および Serverless で利用できます。Apache Hive 3.1.2 は、EMR on EC2 および EMR Serverless で利用できます。Trino 0.367 および PrestoDB 0.267 は、EMR on EC2 でのみ利用できます。
各 Amazon EMR リリースバージョンは、Amazon EMR 向けにデフォルトの Amazon Linux 2 (AL2) Amazon マシンイメージ (AMI) を使用します。Amazon EMR 6.6 より前のデフォルトの AMI は、Amazon EMR リリースの時点で利用可能な最新の Amazon Linux AMI に基づいていました。そのため、Amazon EMR リリースバージョンは、それぞれに割り当てられた AL2 AMI に「ロック」されていました。これは、次の Amazon EMR リリースに移行するか、手動でインストールしない限り、AL2 に対する新しい更新が自動的に更新されないことを意味します。Amazon EMR 6.6 以降のリリースでは、EMR on EC2 クラスターを起動するたびに、Amazon EMR は自動的に最新の AL2 リリースを使用します。詳細については、ドキュメントを参照してください。
Amazon EMR リリース 6.6 以降では、Log4j 1.x および Log4j 2.x を使用するアプリケーションは、それぞれ Log4j 1.2.17 (またはそれ以降) および Log4j 2.17.1 (またはそれ以降) を使用するようにアップグレードされ、CVE の問題を軽減するために、上記のブートストラップアクションの使用を必要としません。
さらに、Amazon EMR リリース 6.6 では、EMR on EC2 でのクラスターの起動時間が、Amazon EMR のデフォルトの AMI オプションを使用し、Apache Hadoop、Apache Spark、Apache Hive などの一般的なアプリケーションをインストールするクラスターで平均 80 秒改善されました。
Amazon EMR リリース 6.6 は、Amazon EMR が提供されているすべてのリージョンで一般的にご利用いただけます。詳細については、Amazon EMR のリージョンごとの利用可否とリリースノートを参照してください。