投稿日: Jan 20, 2022
Amazon EMR と AWS Lake Formation の統合を使用する場合に、Glue Data Catalog テーブルを更新するために Apache Spark SQL を使用することについてのサポートを発表します。
Amazon EMR と AWS Lake Formation の統合により、Apache Spark ユーザーが Glue Data Catalog を介して Amazon S3 のデータにアクセスする際に、データベース、テーブル、および列レベルの許可を定義および適用できます。これまでは、AWS Lake Formation の統合が有効である場合には、SHOW DATABASES や DESCRIBE TABLE などの Spark SQL ステートメントを使用してのみデータを読み取ることができるように制限されていました。今後は、INSERT INTO、INSERT OVERWRITE、および ALTER TABLE のステートメントを使用して、Glue Data Catalog テーブルにデータを挿入したり、Glue Data Catalog テーブルを更新したりすることもできます。
この機能は、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (北カリフォルニア)、米国西部 (オレゴン)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ロンドン)、欧州 (パリ)、欧州 (ストックホルム)、カナダ (中部)、アジアパシフィック (ムンバイ)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (東京)、アジアパシフィック (シドニー)、および南米 (サンパウロ) といった AWS リージョンの Amazon EMR 5.34 でご利用いただけます。
使用を開始するには、Amazon EMR integration with AWS Lake Formation を参照してください。