L’architecture de lake house d’Amazon SageMaker
Simplifiez l’analytique et l’IA grâce à une architecture de données unifiée, ouverte et sécurisée
Présentation
La nouvelle génération d’Amazon SageMaker repose sur une architecture de lake house ouverte, entièrement compatible avec Apache Iceberg. Unifiez toutes vos données dans les lacs de données Amazon Simple Storage Service (Amazon S3), y compris les tableaux S3, et les entrepôts de données Amazon Redshift, ce qui vous permet de créer de puissantes applications d’analytique et d’IA/ML sur une seule copie des données. Accédez à vos données et interrogez-les de manière flexible sur place grâce à tous les outils et moteurs compatibles avec Apache Iceberg. Sécurisez vos données en définissant des autorisations ultraprécises qui sont appliquées à tous les outils et moteurs d’analytique et de machine learning (ML). Transférez des données provenant de bases de données opérationnelles et d’applications dans votre lake house en temps quasi réel grâce à des intégrations zéro ETL. De plus, exécutez des requêtes fédérées sur les données stockées dans plusieurs sources tierces pour accéder à vos données et les interroger sur place.
Voir Amazon SageMaker à l’œuvre
Découvrez comment accéder à des données unifiées à partir de lacs de données S3, de tableaux S3 et d’entrepôts de données Redshift dans un lake house ouvert et sécurisé.

Avantages
Unifiez l’accès à toutes vos données
Unifiez toutes vos données dans les lacs de données Amazon S3, y compris les tableaux S3, et les entrepôts de données Amazon Redshift. Transférez vos données provenant des bases de données opérationnelles et des applications dans le lake house en temps quasi réel grâce à des intégrations zéro ETL. Vous pouvez utiliser des centaines de connecteurs pour intégrer des données provenant de différentes sources. Vous pouvez également accéder aux données et les interroger sur place grâce à des fonctionnalités de requêtes fédérées à travers des sources de données tierces.
Utilisez vos outils et moteurs préférés compatibles avec la norme ouverte Apache Iceberg
Bénéficiez de la flexibilité nécessaire pour accéder à vos données et les interroger sur place à l’aide de tous les outils et moteurs analytiques compatibles avec Apache Iceberg, tels que SQL, Apache Spark, une business intelligence (BI) et les outils d’IA/ML, afin d’accéder aux données unifiées de votre lake house.
Sécurisez vos données grâce à des contrôles d’accès ultraprécis
Cas d’utilisation
Gérez une copie unique des données dans les lacs de données et les entrepôts de données
Unifiez toutes vos données dans les lacs de données Amazon S3 et les entrepôts de données Amazon Redshift pour vos initiatives d’analytique et d’IA avec une seule copie des données. Les contrôles d’accès intégrés vous permettent de définir des autorisations ultraprécises et de partager en toute sécurité une copie unique des données au sein de toute l’entreprise.
Exécutez l’analytique en temps quasi réel sur les données opérationnelles grâce à des intégrations zéro ETL
Accédez à des données en temps quasi réel dans les bases de données opérationnelles et les applications grâce à des intégrations zéro ETL. Accédez à vos données et interrogez-les sur place, à partir d’un large éventail de services AWS et d’outils et moteurs open source et tiers qui prennent en charge Apache Iceberg.
Créez une architecture multi-entrepôts sur Amazon Redshift
Importez les données existantes provenant de plusieurs entrepôts de données Amazon Redshift dans le lake house pour interroger et joindre les données stockées dans des clusters et des groupes de travail Amazon Redshift. Mettez vos charges de travail à l’échelle pour les processus d’extraction, de transformation et de chargement (ETL), les rapports BI et les analyses selon les besoins sans gérer plusieurs partages de données.
Clients
Lennar
« Nous avons passé les 18 derniers mois à travailler avec AWS pour transformer notre infrastructure de données afin d’utiliser les meilleures solutions et les plus rentables. Grâce à des avancées telles qu’Amazon SageMaker Unified Studio et Amazon SageMaker Lakehouse, nous prévoyons d’accélérer notre rapidité de livraison grâce à un accès fluide aux données et aux services, permettant ainsi à nos ingénieurs, analystes et scientifiques de découvrir des informations analytiques qui apportent une valeur significative à notre activité. »
Lee Slezak, vice-président principal des données et de l’analytique chez Lennar

Roche
Roche est un pionnier mondial des produits pharmaceutiques et de diagnostic axés sur le progrès scientifique, dans le but d’améliorer la vie des individus.
« Nous utilisons Amazon Redshift pour obtenir des informations à partir de données structurées et semi-structurées dans tous nos référentiels de données. Le nouvel Amazon SageMaker Lakehouse m’enthousiasme, car il permet d’améliorer et d’unifier l’accès aux lacs de données ou à d’autres sources de données grâce à des services tels qu’Amazon Redshift, le catalogue de données AWS Glue et AWS Lake Formation. Cette innovation permettra à nos équipes de données et d’ingénierie de simplifier l’accès aux données, en favorisant l’interopérabilité entre les charges de travail relatives aux données, à l’analytique et aux applications. Je prévois une réduction notable des erreurs de données grâce à la réduction du nombre de copies de données, à une diminution de 40 % du temps de traitement, à une réécriture plus rapide des données analytiques dans les systèmes transactionnels pour une meilleure prise de décision et à la possibilité pour nos équipes de se concentrer sur la création de valeur métier. »
Yannick Misteli, Chef de l’ingénierie, Stratégie globale des produits chez Roche

Idealista
Idealista soutient les agents immobiliers et les particuliers dans le sud de l’Europe en fournissant une plateforme de petites annonces immobilières en ligne.
« Notre objectif est de rationaliser l’accès aux données Salesforce pour améliorer l’analytique de notre lac de données. En tirant parti de la nouvelle fonctionnalité de prise en charge d’Amazon SageMaker Lakehouse pour les intégrations zéro ETL à partir des applications, nous visons à simplifier nos processus d’extraction et d’ingestion de données, en supprimant la nécessité de recourir à plusieurs ETL pour accéder directement à Salesforce. Cette approche centralisée réduit la complexité et améliore considérablement l’efficacité de notre gestion des données. Nous prévoyons un gain de temps significatif dans le développement de l’extraction et de l’ingestion de données, ce qui permettra à notre équipe de se concentrer sur l’obtention d’informations exploitables à partir de nos données plutôt que sur la gestion de leur collecte. »
Javier Monterrubio, ingénieur responsable de plateformes de données, Idealista

Carrier
« Chez Carrier, la nouvelle mouture d’Amazon SageMaker transforme la stratégie de données de notre entreprise en rationalisant la façon dont nous créons et mettons à l’échelle nos produits de données. L’approche de SageMaker Unified Studio en matière de découverte des données, de traitement et de développement de modèles a considérablement accéléré notre implémentation en matière de lake house. Plus impressionnant encore, son intégration fluide à notre catalogue de données existant et ses contrôles de gouvernance intégrés nous permettent de démocratiser l’accès aux données tout en maintenant les normes de sécurité, aidant ainsi nos équipes à fournir rapidement des solutions d’IA et d’analytique avancées dans l’ensemble de l’entreprise. »

Partenaires
Tableau
Tableau aide les personnes et les organisations à se concentrer davantage sur les données.
« Le partenariat entre Amazon et Salesforce Tableau représente un engagement commun en faveur de l’innovation et de la réussite des clients. Grâce à la nouvelle intégration zéro ETL d’Amazon, nous combinons les données et l’analytique basées sur l’IA de Tableau avec la puissante infrastructure de données d’Amazon afin de transformer la façon dont les entreprises obtiennent des informations à partir de leurs données. Cette intégration fluide permet à nos clients d’obtenir des informations sur toutes leurs données structurées et non structurées en utilisant la puissance d’Amazon SageMaker Lakehouse et d’Amazon Redshift, réduisant ainsi considérablement la complexité de l’ingénierie et le temps de déploiement. Ensemble, Tableau et Amazon aident les clients à accélérer leur transformation numérique et à générer de la valeur métier à grande échelle. »
Ali Tore, vice-président principal, Advanced Analytics, Tableau

dbt Labs
dbt Labs a pour mission d’aider les analystes à créer et à diffuser des connaissances organisationnelles.
« Nous sommes depuis longtemps la référence en matière de transformation basée sur Amazon Redshift, offrant flexibilité, collaboration et confiance. Avec le nouvel Amazon SageMaker Lakehouse, nous sommes ravis d’étendre cette valeur à un plus grand nombre de clients et à davantage de données dans l’environnement AWS. Les clients peuvent désormais accéder à toutes leurs données via le système AWS, y compris les entrepôts de données et les lacs de données. Nous sommes ravis d’associer nos capacités à celles du nouvel Amazon SageMaker afin d’offrir à nos clients communs des services de gouvernance, de catalogage et d’optimisation des données. »
Shawn Toldo, vice-président des partenariats, dbt Labs

Informatica
Informatica, leader de la gestion des données dans le cloud basée sur l’IA d’entreprise, donne vie aux données et à l’IA en permettant aux entreprises de tirer parti du pouvoir de transformation de leurs ressources les plus critiques.
« Notre plateforme Intelligent Data Management Cloud (IDMC) et Amazon SageMaker aident les entreprises à exploiter le potentiel de leurs données et à favoriser l’innovation et l’efficacité. En tant que partenaire de lancement d’Amazon SageMaker Lakehouse, nous sommes fiers de proposer une solution professionnelle qui répond aux normes élevées des organisations modernes orientées données. Avec l’infrastructure AWS, nous permettons de prendre des décisions plus rapides et éclairées pour des résultats efficaces dans tous les secteurs. »
Pratik Parekh, vice-président principal de la gestion des produits, Informatica
