Publié le: Jun 22, 2022

AWS Lake Formation est un service qui vous permet de configurer un lac de données sécurisé en quelques jours. Un lac de données est un référentiel centralisé, organisé et sécurisé qui stocke toutes vos données, à la fois dans leur forme originale et sous forme préparée pour l'analyse. Un lac de données permet de décomposer des silos de données et de combiner différents types d'analyse pour obtenir des informations et guider de meilleures décisions commerciales.

La création d'un lac de données avec Lake Formation vous permet de définir l'emplacement de vos données et les stratégies d'accès et de sécurité des données que vous désirez appliquer. Ensuite, Lake Formation collecte et catalogue les données des bases de données et du stockage d'objets, les transfère dans votre nouveau lac de données Amazon S3, les nettoie et les classe à l'aide d'algorithmes de machine learning, et sécurise l'accès à vos données sensibles. Vos utilisateurs peuvent par la suite accéder à un catalogue centralisé de données décrivant les jeux de données disponibles et leur utilisation appropriée. Vos utilisateurs peuvent ensuite exploiter ces jeux de données avec leur choix d'analytique et de services de machine learning, tels qu'Amazon EMR pour Apache Spark, Amazon Redshift Spectrum, AWS Glue, Amazon QuickSight et Amazon Athena.