AWS Lake Formation

Créez un lac de données sécurisé en quelques jours

AWS Lake Formation est un service qui facilite la configuration d’un lac de données sécurisé en quelques jours. Un lac de données est un référentiel centralisé, organisé et sécurisé qui stocke toutes vos données, à la fois dans leur forme originale et sous forme préparée pour l’analyse. Un lac de données permet de décomposer des silos de données et de combiner différents types d’analyse pour obtenir des informations et guider de meilleures décisions commerciales.

Cependant, aujourd’hui, la mise en place et la gestion de lacs de données implique la réalisation de nombreuses tâches manuelles, compliquées et fastidieuses. Ce travail comprend le chargement de données provenant de diverses sources, la surveillance de ces flux de données, la configuration de partitions, l’activation du chiffrement et la gestion des clés, la définition des tâches de transformation et la surveillance de leur fonctionnement, la réorganisation des données dans un format en colonnes, la configuration des paramètres de contrôle d’accès, la déduplication de données redondantes, l’appariement des enregistrements liés, l’octroi de l’accès aux ensembles de données et l’audit des accès à travers le temps.

Pour créer un lac de données avec Lake Formation, il vous suffit de définir l'emplacement de vos données et les stratégies d'accès et de sécurité des données que vous souhaitez appliquer. Ensuite, Lake Formation collecte et catalogue les données des bases de données et du stockage d'objets, les transfère dans votre nouveau lac de données Amazon S3, les nettoie et les classe à l'aide d'algorithmes machine learning, et sécurise l'accès à vos données sensibles. *Vos utilisateurs peuvent par la suite accéder à un catalogue centralisé de données décrivant les ensembles de données disponibles et leur utilisation appropriée. Vos utilisateurs peuvent ensuite exploiter ces ensembles de données avec leur choix d'analyses et de services de machine learning, comme Amazon EMR pour Apache Spark, Amazon Redshift, Amazon Athena, Amazon Sagemaker et Amazon QuickSight.

AWS re:Invent 2018 - Présentation d’AWS Lake Formation

Avantages

Création rapide de lacs de données

Avec Lake Formation, vous pouvez déplacer, stocker, cataloguer et nettoyer vos données plus rapidement. Il vous suffit de pointer Lake Formation vers vos sources de données. Lac Formation explorera ces sources et les transférera vers votre nouveau lac de données Amazon S3. Lake formation organise les données dans S3 autour des termes de requête fréquemment utilisés et en morceaux de taille correcte pour augmenter l'efficacité. Lake Formation modifie également les données dans des formats tels que Apache Parquet et ORC pour une analyse plus rapide. En outre, Lake Formation dispose d’un système de machine learning de la déduplication et de la recherche des enregistrements correspondants (deux entrées se rapportant à la même chose) pour améliorer la qualité des données.

Gestion de la sécurité simplifiée

Vous pouvez utiliser Lake Formation pour définir de manière centralisée les stratégies de sécurité, de gouvernance et d'audit en un seul lieu, plutôt que d'effectuer ces tâches par service, puis appliquer ces stratégies à vos utilisateurs dans leurs applications d'analyse. Vos stratégies sont systématiquement mises en œuvre, ce qui vous évite de les configurer manuellement pour les services de sécurité (AWS Identity and Access Management et AWS Key Management Service), les services de stockage (S3) et les services d'analyse et de machine learning (Redshift, Athena et EMR for Apache Spark.) Cela réduit les efforts de configuration des stratégies entre les services et assure une mise en œuvre et une conformité cohérentes.

Facilitez et sécurisez l'accès aux données en libre-service

Avec Lake Formation, vous créez un catalogue de données décrivant les différents jeux de données disponibles, ainsi que les groupes d'utilisateurs ayant accès à chacun d'eux. Cela rend vos utilisateurs plus productifs en les aidant à trouver le bon ensemble de données à analyser. En fournissant un catalogue de vos données avec des règles de sécurité cohérentes, Lake Formation permet à vos analystes et scientifiques des données d'utiliser plus facilement leur service d'analyse préféré.
Ils peuvent utiliser EMR pour Apache Spark, Redshift, Athena, Sagemaker ou QuickSight sur divers ensembles de données hébergés dans un même lac de données. Les utilisateurs peuvent également combiner ces services sans avoir à déplacer des données entre des silos.

Fonctionnement

AWS Lake Formation - Fonctionnement

Lake Formation aide à construire, sécuriser et gérer votre lac de données. Commencez par identifier les magasins de données existants dans S3 ou dans les bases de données relationnelles et NoSQL, puis déplacez les données dans votre lac de données. Ensuite, analysez, cataloguez et préparez les données pour l'analyse. Puis, donnez à vos utilisateurs un accès sécurisé aux données en libre-service via leur choix de services d’analyse. D'autres services AWS et des applications tierces peuvent également accéder aux données via les services affichés. Lake Formation gère toutes les tâches de la boîte orange et est intégré aux magasins de données et aux services indiqués dans les boîtes bleues.

Cas d'utilisation

En apprendre plus sur « Qu’est-ce qu’un lac de données ? » et sur les cas d’utilisation.

Clients

change-healthcare-red-blue-logo

Change Healthcare est une société indépendante de premier plan dans le secteur des technologies de la santé qui fournit des solutions basées sur les données et l’analyse, qui atteignent environ 2 100 connexions gouvernementales et commerciales, 5 500 hôpitaux, 900 000 médecins et 33 000 pharmacies.

« Nous traitons quotidiennement des données provenant de millions de transactions tout en respectant les réglementations du secteur de la santé, y compris HIPAA », a déclaré Aaron Symanski, CTO de Change Healthcare. « Nous sommes très emballés par le lancement d’AWS Lake Formation, qui fournit un point de contrôle central pour charger, nettoyer, sécuriser et cataloguer facilement les données de milliers de clients dans notre lac de données basé sur AWS, réduisant ainsi considérablement notre charge opérationnelle. Les contrôles d’accès aux données de Lake Formation nous permettront de définir facilement nos règles et de les appliquer à tous les services d’analyse et de machine learning que nous utilisons, ainsi que des journaux d’audit indiquant la conformité. De plus, Lake Formation sera conforme à la norme HIPAA dès le premier jour. Elle respectera donc nos exigences de sécurité et nous offrira un excellent moyen de bâtir et de gérer notre lac de données. »

Fender_digital

Fender Digital fait partie de Fender, la marque de guitare emblématique, qui fabrique des applications, des sites Web, des plates-formes et des outils pour compléter les guitares, les amplis et les équipements audio fabriqués par Fender.

« Nous générons des tonnes de données sur les utilisateurs et l'utilisation à partir de nos applications et périphériques numériques. Nous prévoyons de créer un lac de données sur AWS qui sera exploité parallèlement à notre entrepôt de données basé sur Amazon Redshift », a déclaré Joshua Couch, vice-président de l'ingénierie chez Fender Digital. « J’ai hâte que mon équipe mette la main sur AWS Lake Formation. Lake Formation nous facilitera le chargement, la transformation et le catalogage de nos données et les rendra disponibles de manière sécurisée au sein de notre organisation, à travers un vaste portfolio de services AWS. Avec une option prête à une utilisation en entreprise telle que Lake Formation, nous pourrons passer plus de temps à tirer profit de nos données plutôt que de faire le lourd travail nécessaire à la configuration et à la gestion manuelles de notre lac de données. »

Product-Page_Standard-Icons_01_Product-Features_SqInk
En savoir plus sur les fonctionnalités d’AWS Lake Formation
En savoir plus 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Créer un compte
S'inscrire 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Commencez à créer sur la console
Se connecter