Lacs de données sur AWS
Créez, testez et déployez rapidement votre lac de données avec AWS et les solutions des partenaires.
Présentation
Les outils traditionnels de stockage et d’analytique des données n’offrent plus l’agilité et la flexibilité nécessaires pour obtenir des informations métier pertinentes. C’est pourquoi de nombreuses organisations adoptent une architecture de lac de données. Grâce aux démarrages rapides pour les lacs de données et aux solutions prêtes pour les clients, AWS et ses partenaires spécialisés accélèrent et simplifient la création de votre lac de données. Un lac de données est une approche architecturale qui vous permet de stocker d’immenses volumes de données dans un emplacement central, afin qu’elles puissent être facilement catégorisées, traitées, analysées et exploitées par différents groupes au sein d’une organisation. Comme les données peuvent être stockées en l’état, il n’est pas nécessaire de les convertir dans un schéma prédéfini, et vous n’avez plus besoin de savoir à l’avance quelles questions vous souhaitez poser à vos données.
Un lac de données sur AWS peut vous aider à :
-
Collecter et stocker tout type de données, à n’importe quelle échelle et à faible coût
-
Sécuriser les données et empêcher tout accès non autorisé
-
Cataloguer, rechercher et trouver les données pertinentes dans le référentiel central
-
Effectuer rapidement et facilement de nouveaux types d’analyse de données
-
Utiliser un large éventail de moteurs analytiques pour l’analytique ad hoc, la diffusion en temps réel, l’analytique prédictive, l’intelligence artificielle (IA) et le machine learning
Un lac de données peut également compléter et étendre votre entrepôt de données existant. Si vous utilisez déjà un entrepôt de données ou envisagez d’en mettre un en œuvre, un lac de données peut servir de source pour les données structurées comme non structurées.
Création d’un lac de données sur AWS
Avantages d’un lac de données sur AWS
-
Intégrez facilement des données de différentes manières, notamment en utilisant Amazon Kinesis, AWS Import/Export Snowball, AWS Direct Connect, etc. Stockez toutes vos données, quel que soit leur volume ou leur format, à l’aide d’Amazon Simple Storage Service (Amazon S3).
-
Déployez l’infrastructure dont vous avez besoin presque instantanément. Vos équipes peuvent donc être plus productives, il vous est plus facile d’innover et les projets sont déployés plus rapidement.
-
AWS met à disposition des installations, réseaux, logiciels et processus métier les capacités nécessaires pour répondre aux exigences les plus strictes. Les environnements sont continuellement audités pour vérifier leurs certifications, notamment ISO 27001, FedRAMP, DoD SRG et PCI DSS.
-
Créez pratiquement n’importe quelle application de big data et soutenez toutes les charges de travail, quels que soient le volume, la vitesse et la diversité des données. Avec plus de cinquante services et des centaines de fonctionnalités ajoutées chaque année, AWS vous fournit tout ce dont vous avez besoin pour collecter, stocker, traiter, analyser et visualiser le big data dans le cloud.
Télécharger l’e‑book
Découvrez comment AWS et les partenaires spécialisés APN ont aidé des organisations à migrer d’énormes volumes de données hétérogènes vers un lac de données sur AWS, où elles peuvent les exploiter rapidement et simplement pour obtenir des informations métier essentielles.
Partenaires technologiques APN présentés
Attunity
Fanatics, un site de vêtements de sport très connu et vendeur d’articles pour supporters, devait ingérer des téraoctets de données provenant de plusieurs sources historiques et de diffusion en continu (systèmes transactionnels, e-commerce et back-office) dans un lac de données sur Amazon S3. Une fois ingérées, les données devaient être analysées afin de mieux identifier, prévoir et satisfaire les besoins des clients liés aux produits que Fanatics propose dans plus de 300 magasins en ligne et physiques.
Pour y parvenir, Fanatics a choisi Attunity Replicate, une solution logicielle qui propose la capture de données en continu (CDC) et le traitement parallèle des threads pour diffuser en temps réel des données provenant de plusieurs sources vers un lac de données sur Amazon S3. Les données peuvent ensuite être consommées dans Apache Kafka pour l’analytique en temps réel. Attunity évite à Fanatics le travail fastidieux d’extraction manuelle de données provenant de sources disparates et permet à l’organisation d’obtenir des résultats en temps réel.
Titre du webinaire : Fanatics Ingests Streaming Data to a Data Lake on AWS
Présentateur client : Alan Chang, responsable produit principal chez Fanatics
Présentateur Attunity : Jordan Martz, directeur de la technologie
Présentateur AWS : Paul Sears, architecte de solutions
Databricks
L’exécution de charges de travail de science des données sur des données issues de sources disparates (lac de données, entrepôt de données, diffusion en continu, etc.) pose des défis aux organisations qui doivent exploiter leurs données pour améliorer leurs opérations et leurs produits. L’éditeur de manuels scolaires McGraw-Hill devait éliminer ces silos de données afin de transformer son modèle économique pour répondre à l’importance croissante de l’apprentissage numérique. L’entreprise souhaitait notamment pouvoir exécuter rapidement des opérations d’analytique complexes et permettre la collaboration entre les analystes métier, les ingénieurs de données et les scientifiques des données.
McGraw-Hill a déployé Databricks, une plateforme d’analytique unifiée qui lui permet de travailler efficacement avec des données diffusées en continu ainsi qu’avec des données historiques stockées dans des lacs de données sur Amazon S3 et dans plusieurs entrepôts de données. Dans ce webinaire, vous découvrirez comment Databricks, développé par les créateurs d’origine d’Apache Spark™, permet à McGraw-Hill d’analyser des données de diffusion en continu et historiques à une échelle et à une vitesse que sa solution précédente ne pouvait tout simplement pas atteindre. Les charges de travail de science des données qui prenaient auparavant des semaines sont désormais effectuées en quelques heures.
Titre du webinaire : McGraw-Hill Optimizes Analytics Workloads with Databricks
Présentateur client : Matthew Ashbourne, ingénieur logiciel en chef chez McGraw-Hill Education
Présentateur Databricks : Brian Dirking, directeur principal du marketing partenaires
Présentateur AWS : Pratap Ramamurthy, architecte de solutions partenaires
Qubole
Les technologies de big data peuvent s’avérer complexes tout en nécessitant des processus manuels chronophages. Les organisations qui automatisent intelligemment les opérations de big data réduisent leurs coûts, améliorent la productivité de leurs équipes, gèrent plus efficacement la mise à l’échelle et réduisent le risque d’échec.
Dans notre webinaire, des représentants de TiVo, créateur d’une plateforme d’enregistrement numérique de contenu télévisuel, expliqueront comment ils ont mis en œuvre une nouvelle plateforme big data et analytique capable de se mettre à l’échelle dynamiquement en fonction de l’évolution de la demande. Vous découvrirez comment la solution permet à TiVo d’orchestrer facilement des clusters big data à l’aide d’Amazon Elastic Compute Cloud (Amazon EC2) et d’instances Spot Amazon EC2 qui lisent les données d’un lac de données sur Amazon Simple Storage Service (Amazon S3), et comment elle réduit les coûts et les efforts de développement nécessaires pour accompagner les utilisateurs de son réseau et de ses annonceurs. TiVo partagera les enseignements tirés et les bonnes pratiques pour ingérer, traiter et mettre à disposition à des fins d’analyse, rapidement et à moindre coût, des téraoctets de données d’audience diffusées en continu et par lots provenant de millions de foyers.
Titre du webinaire : TiVo: How to scale new products with a data lake on AWS and Qubole
Présentateur client : Ashish Mrig, responsable principal de l’analytique big data chez TiVo
Présentateur Qubole : Harsh Jetly, architecte de solutions
Présentateur AWS : Paul Sears, architecte de solutions
Talend
Découvrez comment réduire les délais de développement et innover sur AWS. Dans ce webinaire, Beachbody, fournisseur de vidéos d’exercices à domicile pour le fitness, la perte de poids et la musculation, revient sur son expérience de migration vers une architecture de lac de données sur AWS avec Talend. Beachbody expliquera comment l’entreprise a créé une plateforme de données d’entreprise ouverte, qui permet à ses employés d’accéder à des données sécurisées et bien gouvernées, tout en améliorant l’efficacité DevOps à l’échelle de l’entreprise.
Participez à notre webinaire et découvrez comment Talend et AWS ont aidé Beachbody à migrer diverses sources de données non structurées et structurées vers un lac de données, à raccourcir les cycles de développement et de test, et à résoudre les difficultés de déploiement complexes courantes avec les données en temps réel.
Titre du webinaire : Architecting an Open Data Lake for the Enterprise
Présentateur Talend : Ashwin Viswanath, directeur du marketing produit cloud
Présentateur client : Eric Anderson, directeur exécutif responsable des données chez Beachbody
Présentateur AWS : Pratap Ramamurthy, architecte de solutions
Informatica
La solution Informatica Intelligent Data Lake Management vous permet d’ingérer, de nettoyer, de traiter, de gouverner et de sécuriser de grands volumes de données brutes dans un lac de données fiable sur AWS. L’IA pilotée par les métadonnées et les capacités de catalogage d’entreprise d’Informatica permettent aux parties prenantes métier, comme les analystes, de découvrir, profiler, préparer et sécuriser rapidement les données afin d’obtenir en temps utile des informations métier pertinentes. En résumé, Informatica permet aux entreprises d’exploiter la puissance d’un lac de données sur AWS et de libérer des informations sur le big data qui contribuent à stimuler l’innovation et les ventes.
Looker
Les entreprises d’aujourd’hui reposent sur le big data, et les métriques générées par ces données doivent être définies de manière centralisée et largement accessibles pour apporter une réelle valeur. C’est là qu’intervient Looker, une plateforme de données moderne qui permet à chaque personne dans l’entreprise de trouver et d’explorer les données dont elle a besoin pour prendre des décisions. Looker est conçu pour les plateformes cloud comme Amazon Web Services (AWS) et vous permet d’interroger directement des bases de données cloud modernes, comme les lacs de données. Les clients utilisent Looker pour l’analytique interne, mais aussi pour mettre des données à disposition de leurs clients, partenaires et fournisseurs.
Partenaires de conseil APN présentés
Simplifiez le déploiement d’un lac de données basé sur le cloud avec AWS et Talend.
Gagnez en sérénité grâce au processus éprouvé en trois étapes de Cloudwick pour concevoir et gérer des lacs de données sur AWS.
Appuyez-vous sur l’expérience de NorthBay et sur son alignement étroit avec AWS pour créer votre solution de lac de données personnalisée.