投稿日: Aug 9, 2019

Amazon EMR で、AWS Lake Formation ベースのきめ細かいアクセス制御ポリシーを Apache Spark に適用できるようになりました。Amazon S3 に保存されているデータに対して、データベース、テーブル、列レベルのポリシーを適用できます。AWS Lake Formation で定義したポリシーは、Apache Zeppelin または EMR Notebooks を使用して Spark アプリケーションが送信されたときに適用されます。このリリースには、EMR ノートブックおよび Apache Zeppelin への SAML ベースのシングルサインオン (SSO) も含まれています。これにより、Active Directory Federation Services (ADFS)、Okta、Auth0 を使用する組織の認証を簡素化します。SAML ベースの SSO と AWS Lake Formation ポリシーの組み合わせにより、お客様は、Amazon S3 に保存されたデータへの列レベルのアクセス権を持つ共有マルチテナントクラスターで Spark アプリケーションを安全に実行できます。

AWS Lake Formation はデータレイクの構築、セキュリティ向上、管理をサポートするフルマネージドサービスです。Lake Formation では、データの収集、クレンジング、カタログ作成、さらには分析データのセキュリティ確保など、データレイクの作成に伴う多くの複雑な手作業を簡素化し、自動化します。これまで、お客様は、データアクセスのためのロールを設定したり、ストレージおよびさまざまな分析エンジンにそれぞれセキュリティポリシーを適用したり、アクセス許可の変更時や新規エンドユーザーの追加時にセキュリティポリシーを更新したりする必要がありました。Lake Formation を使用すれば、ポリシーを一度だけ定義し、Amazon EMR、Amazon Redshift Spectrum、AWS Glue、Amazon Athena などのサービスにそれを同じように適用できます。

AWS Lake Formation と Amazon EMR の統合は現在ベータ版であり、米国東部 (バージニア北部) および米国西部 (オレゴン) リージョンの EMR 5.26.0 リリースで利用できます。 

使用を開始するには、Amazon EMR と AWS Lake Formation の統合 (ベータ版) を参照してください。 

EMR リリースの最新情報を得るには、EMR リリースノートのフィードにサブスクライブしてください。EMR リリースガイドの上部にあるアイコンを使ってフィード URL をお使いのフィードリーダーに直接リンクしてください。