投稿日: Nov 3, 2016
Apache Flink 1.1.3 とアップグレードしたバージョンの Apache Zeppelin (0.6.2)、Apache HBase (1.2.3) を Amazon EMR リリース 5.1.0 で使用できるようになりました。また、Hue のインタラクティブノートブックが Presto を使用してデータクエリをサポートするようになりました。
ストリーミングデータフローエンジンの Apache Flink は、高スループットのデータソースでリアルタイムのストリーム処理を行いやすくします。アウトオブオーダーイベントのイベントタイムセマンティクス、正確に 1 度しか処理しないセマンティクス、バックプレッシャーコントロール、ストリーミングとバッチアプリケーション両方への書き込みに最適化した API をサポートします。 さらに、Flink は Amazon Kinesis Streams、Apache Kafka、Elasticsearch、Twitter Streaming API、Cassandra、Amazon S3 (EMRFS 使用) と HDFS のアクセスデータのコネクターも備えています。
AWS マネジメントコンソール、AWS CLI または SDK からリリースラベル「emr-5.1.0」を選択し、リリース 5.1.0 で Amazon EMR クラスターを作成できます。クラスターでこうしたアプリケーションをインストールするため Flink、Zeppelin、HBase を指定できます。リリース 5.1.0、Flink 1.1.3、Zeppelin 0.6.2、HBase 1.2.3 の詳細については Amazon EMR ドキュメントをご覧ください。