投稿日: Mar 14, 2023

Amazon EMR に新機能が追加されました。Amazon EMR ステップ API を使用して送信された Apache Hive ジョブによる書き込みオペレーション (INSERT INTO、INSERT OVERWRITE) の権限を、Amazon S3 データレイク上の AWS Lake Formation ベースのテーブルおよび列レベルで適用できるようになりました。この機能により、データ管理者は Amazon EMR で実行される Apache Hive 経由でデータにアクセスする顧客に対して、テーブルおよび列レベルのきめ細かなセキュリティを定義して適用できます。

Amazon EMR と AWS Lake Formation の統合により、Amazon EMR で実行される Apache Spark や Apache Hive といったオープンソースのデータ処理エンジンを使用して、データベース、テーブル、列レベルの権限を定義および適用できます。これまでデータ管理者は、EMR 上の Apache Hive を使用する読み取り専用ワークロードのデータベース、テーブル、列に対して、Lake Formation ベースの権限を定義して適用できました。今回のリリースでは、Hive を使用して Lake Formation 対応のテーブルに書き込みや変更を行えるようになりました。つまり、INSERT INTO、INSERT OVERWRITE、ALTER TABLE クエリの実行時に、Lake Formation ベースのデータベース、テーブル、列レベルの権限を適用できます。Lake Formation ベースの権限を使用するには、メタストアとして Glue データカタログを使用する必要があります。

この機能は、Amazon EMR を提供中のすべてのリージョンにおける、EC2 クラスター上の Amazon EMR のリリース 6.10 で利用できます。使用を開始するには、Amazon EMR ドキュメントの Integrate Amazon EMR with AWS Lake Formation (Amazon EMR と AWS Lake Formation の統合) セクションを参照してください。