投稿日: Sep 21, 2016

保存データや転送中データの暗号化を Amazon EMR の Apache SparkApache TezApache Hadoop MapReduce で簡単に有効にできるようになりました。保存データの暗号化では、各ノードと Hadoop Distributed File System (HDFS) のローカルファイルシステムにある EMR ファイルシステム (EMRFS) を使用する Amazon S3 の保存データと、Amazon EMR クラスターに保存しているデータを暗号化することができます。転送中データの暗号化では、Amazon EMR が Apache Spark、Apache Tez、Apache Hadoop MapReduce のオープンソースの暗号化機能を有効にします。

クラスターで暗号化に使用するキーや証明書を特定する Amazon EMR セキュリティ設定で、サポートされているコンポーネントの暗号化を簡単に設定することができます。セキュリティ設定の名前は AWS リソースで、Amazon EMR サービスに保存されています。

Amazon EMR コンソール、AWS コマンドラインインターフェイス (CLI)、Amazon EMR API を使用する Amazon SDK のセキュリティ設定ページでセキュリティ設定を作成することができます。セキュリティ設定の作成後、Amazon EMR クラスターの作成時に設定を特定できます。暗号化キーを提供するには、AWS Key Management Service (KMS) またはカスタムキーマネジメントインフラストラクチャを使用できます。転送中データの暗号化には Amazon S3 に保存している TLS 証明書を使用することができます。セキュリティ設定は Amazon EMR リリース 5.0.0 と 4.8.0 でサポートされています。詳しくは Amazon EMR ドキュメント「セキュリティ設定」、「各ストレージレイヤーの保存データの暗号化」、「対応済みエンジンの転送中データのメカニズム」をご覧ください。