Amazon EMR on EC2 が Apache Spark ネイティブの FGAC と AWS Glue データカタログビューのサポートを追加

投稿日: 2025年8月29日

Amazon EMR on EC2 で、ガバナンスに関する 2 つの重要な機能が強化されることが発表されました。1 つは AWS Lake Formation による Apache Spark ネイティブのきめ細かなアクセスコントロール (FGAC) で、もう 1 つは AWS Glue データカタログビューのサポートです。これらの機能により、組織は分析環境全体でデータセキュリティを強化し、アクセス管理を簡素化し、データ共有機能を強化できます。

Apache Spark ネイティブの FGAC 実装により、お客様は AWS Lake Formation できめ細かなアクセスポリシーを一度定義したら、そのポリシーを EMR クラスター全体に一貫して適用できます。これにより、統一された仕組みに基づいてデータガバナンスを行えるようになり、セキュリティリスクと管理上のオーバーヘッドが軽減されます。お客様は、他の AWS 分析サービスと同様に、使い慣れた Lake Formation の GRANT ステートメントや REVOKE ステートメントを使用して、EMR on EC2 上の Spark ジョブとインタラクティブセッションのアクセスコントロールを管理できるようになりました。

AWS Glue データカタログビューを使用すると、AWS リージョン、アカウント、および組織全体でマルチエンジン SQL ビューを作成、管理、およびクエリできます。この機能により、管理者は Lake Formation のアクセス許可を使用してデータアクセスをコントロールしつつ、複数のエンジンからクエリできる Spark ジョブからビューを作成できます。これらのアクセス許可には、名前付きリソース許可、データフィルター、タグが含まれ、すべてのアクセスリクエストは包括的な監査を目的として AWS CloudTrail に自動的に記録されます。

Apache Spark ネイティブの FGAC および Glue データカタログビュー機能は、EMR on EC2 が提供されているすべての AWS リージョンにおいて、Amazon EMR リリース 7.10 で利用できます。詳細については、Amazon EMR ドキュメントで Amazon EMR での AWS Lake Formation の使用および AWS Glue データカタログビューの操作について参照してください。