AWS Lake Formation étend les autorisations relatives aux tableaux pour accéder aux données sous-jacentes dans Amazon S3
AWS Lake Formation vous permet désormais de lire et d’écrire les fichiers de données sous-jacents dans Amazon S3 pour les tableaux enregistrés dans le Catalogue de données AWS Glue. Cela vous fournit un ensemble unique d’autorisations pour les requêtes SQL et l’accès direct aux fichiers à l’aide de vos autorisations de tableaux Lake Formation existants.
Avec ce lancement, Lake Formation fournit des informations d’identification temporaires et étendues pour les emplacements S3 enregistrés en fonction des autorisations de vos tableaux. Les autorisations SELECT accordent un accès en lecture et les autorisations SUPER accordent un accès en lecture et en écriture aux données à cet emplacement. Cette fonctionnalité est intégrée à Amazon EMR 7.13 ou aux versions ultérieures. Par conséquent, vous pouvez accéder aux fichiers de données directement depuis vos tâches Spark pour les tâches nécessitant un accès au niveau des fichiers, telles que l’entraînement des modèles, l’ingénierie des caractéristiques ou le débogage des problèmes de qualité des données.
Vous pouvez également intégrer vos applications Apache Spark ou Trino à l’aide d’API ou via un modèle d’extension open source fourni par AWS. En outre, tous les accès sont enregistrés dans AWS CloudTrail afin de fournir une piste d’audit unifiée pour les opérations SQL et basées sur des fichiers sur vos tableaux.
Cette fonctionnalité est disponible sans frais supplémentaires dans toutes les Régions AWS dans lesquelles AWS Lake Formation est disponible. Pour en savoir plus, consultez la documentation de Lake Formation, la documentation EMR, la référence de l’API et le modèle d’extension open source.