Passer au contenu principal

Analytique sur AWS

Lacs de données sur AWS

Créez, testez et déployez rapidement votre lac de données avec AWS et les solutions des partenaires.

Présentation

Les outils traditionnels de stockage et d’analytique des données n’offrent plus l’agilité et la flexibilité nécessaires pour obtenir des informations métier pertinentes. C’est pourquoi de nombreuses organisations adoptent une architecture de lac de données. Grâce aux démarrages rapides pour les lacs de données et aux solutions prêtes pour les clients, AWS et ses partenaires spécialisés accélèrent et simplifient la création de votre lac de données. Un lac de données est une approche architecturale qui vous permet de stocker d’immenses volumes de données dans un emplacement central, afin qu’elles puissent être facilement catégorisées, traitées, analysées et exploitées par différents groupes au sein d’une organisation. Comme les données peuvent être stockées en l’état, il n’est pas nécessaire de les convertir dans un schéma prédéfini, et vous n’avez plus besoin de savoir à l’avance quelles questions vous souhaitez poser à vos données.

Démarrages rapides pour les lacs de données

Un lac de données sur AWS peut vous aider à :

  • Collecter et stocker tout type de données, à n’importe quelle échelle et à faible coût

  • Sécuriser les données et empêcher tout accès non autorisé

  • Cataloguer, rechercher et trouver les données pertinentes dans le référentiel central

  • Effectuer rapidement et facilement de nouveaux types d’analyse de données

  • Utiliser un large éventail de moteurs analytiques pour l’analytique ad hoc, la diffusion en temps réel, l’analytique prédictive, l’intelligence artificielle (IA) et le machine learning

Un lac de données peut également compléter et étendre votre entrepôt de données existant. Si vous utilisez déjà un entrepôt de données ou envisagez d’en mettre un en œuvre, un lac de données peut servir de source pour les données structurées comme non structurées.

Création d’un lac de données sur AWS

Un lac de données sur AWS vous donne accès à la plateforme la plus complète pour le big data. AWS met à votre disposition une infrastructure sécurisée et un large éventail de services à l’échelle et économiques pour collecter, stocker, catégoriser et analyser vos données afin d’en tirer des informations pertinentes. AWS simplifie la création et l’adaptation de votre lac de données à vos besoins spécifiques en matière d’analytique des données. Vous pouvez commencer avec l’un des démarrages rapides disponibles ou faire appel aux compétences et à l’expertise d’un partenaire APN pour le mettre en œuvre pour vous. Un lac de données peut servir de source pour les données structurées comme non structurées.

Avantages d’un lac de données sur AWS

    Intégrez facilement des données de différentes manières, notamment en utilisant Amazon Kinesis, AWS Import/Export Snowball, AWS Direct Connect, etc. Stockez toutes vos données, quel que soit leur volume ou leur format, à l’aide d’Amazon Simple Storage Service (Amazon S3).

    Déployez l’infrastructure dont vous avez besoin presque instantanément. Vos équipes peuvent donc être plus productives, il vous est plus facile d’innover et les projets sont déployés plus rapidement.

    AWS met à disposition des installations, réseaux, logiciels et processus métier les capacités nécessaires pour répondre aux exigences les plus strictes. Les environnements sont continuellement audités pour vérifier leurs certifications, notamment ISO 27001, FedRAMP, DoD SRG et PCI DSS. 

    Créez pratiquement n’importe quelle application de big data et soutenez toutes les charges de travail, quels que soient le volume, la vitesse et la diversité des données. Avec plus de cinquante services et des centaines de fonctionnalités ajoutées chaque année, AWS vous fournit tout ce dont vous avez besoin pour collecter, stocker, traiter, analyser et visualiser le big data dans le cloud.

Télécharger l’e‑book

Découvrez comment AWS et les partenaires spécialisés APN ont aidé des organisations à migrer d’énormes volumes de données hétérogènes vers un lac de données sur AWS, où elles peuvent les exploiter rapidement et simplement pour obtenir des informations métier essentielles.

Télécharger l’e‑book

Partenaires technologiques APN présentés

  

Attunity

Fanatics, un site de vêtements de sport très connu et vendeur d’articles pour supporters, devait ingérer des téraoctets de données provenant de plusieurs sources historiques et de diffusion en continu (systèmes transactionnels, e-commerce et back-office) dans un lac de données sur Amazon S3. Une fois ingérées, les données devaient être analysées afin de mieux identifier, prévoir et satisfaire les besoins des clients liés aux produits que Fanatics propose dans plus de 300 magasins en ligne et physiques.

Pour y parvenir, Fanatics a choisi Attunity Replicate, une solution logicielle qui propose la capture de données en continu (CDC) et le traitement parallèle des threads pour diffuser en temps réel des données provenant de plusieurs sources vers un lac de données sur Amazon S3. Les données peuvent ensuite être consommées dans Apache Kafka pour l’analytique en temps réel. Attunity évite à Fanatics le travail fastidieux d’extraction manuelle de données provenant de sources disparates et permet à l’organisation d’obtenir des résultats en temps réel.

Titre du webinaire : Fanatics Ingests Streaming Data to a Data Lake on AWS

Présentateur client : Alan Chang, responsable produit principal chez Fanatics
Présentateur Attunity : Jordan Martz, directeur de la technologie
Présentateur AWS : Paul Sears, architecte de solutions

En savoir plus

Lire l’étude de cas

Attunity logo displayed horizontally on a white background.

Databricks

L’exécution de charges de travail de science des données sur des données issues de sources disparates (lac de données, entrepôt de données, diffusion en continu, etc.) pose des défis aux organisations qui doivent exploiter leurs données pour améliorer leurs opérations et leurs produits. L’éditeur de manuels scolaires McGraw-Hill devait éliminer ces silos de données afin de transformer son modèle économique pour répondre à l’importance croissante de l’apprentissage numérique. L’entreprise souhaitait notamment pouvoir exécuter rapidement des opérations d’analytique complexes et permettre la collaboration entre les analystes métier, les ingénieurs de données et les scientifiques des données.

McGraw-Hill a déployé Databricks, une plateforme d’analytique unifiée qui lui permet de travailler efficacement avec des données diffusées en continu ainsi qu’avec des données historiques stockées dans des lacs de données sur Amazon S3 et dans plusieurs entrepôts de données. Dans ce webinaire, vous découvrirez comment Databricks, développé par les créateurs d’origine d’Apache Spark™, permet à McGraw-Hill d’analyser des données de diffusion en continu et historiques à une échelle et à une vitesse que sa solution précédente ne pouvait tout simplement pas atteindre. Les charges de travail de science des données qui prenaient auparavant des semaines sont désormais effectuées en quelques heures.

Titre du webinaire : McGraw-Hill Optimizes Analytics Workloads with Databricks
Présentateur client : Matthew Ashbourne, ingénieur logiciel en chef chez McGraw-Hill Education
Présentateur Databricks : Brian Dirking, directeur principal du marketing partenaires
Présentateur AWS : Pratap Ramamurthy, architecte de solutions partenaires

En savoir plus

The Databricks logo featuring a red stacked box icon and the word 'databricks' in black text.

Qubole

Les technologies de big data peuvent s’avérer complexes tout en nécessitant des processus manuels chronophages. Les organisations qui automatisent intelligemment les opérations de big data réduisent leurs coûts, améliorent la productivité de leurs équipes, gèrent plus efficacement la mise à l’échelle et réduisent le risque d’échec.

Dans notre webinaire, des représentants de TiVo, créateur d’une plateforme d’enregistrement numérique de contenu télévisuel, expliqueront comment ils ont mis en œuvre une nouvelle plateforme big data et analytique capable de se mettre à l’échelle dynamiquement en fonction de l’évolution de la demande. Vous découvrirez comment la solution permet à TiVo d’orchestrer facilement des clusters big data à l’aide d’Amazon Elastic Compute Cloud (Amazon EC2) et d’instances Spot Amazon EC2 qui lisent les données d’un lac de données sur Amazon Simple Storage Service (Amazon S3), et comment elle réduit les coûts et les efforts de développement nécessaires pour accompagner les utilisateurs de son réseau et de ses annonceurs. TiVo partagera les enseignements tirés et les bonnes pratiques pour ingérer, traiter et mettre à disposition à des fins d’analyse, rapidement et à moindre coût, des téraoctets de données d’audience diffusées en continu et par lots provenant de millions de foyers.

Titre du webinaire : TiVo: How to scale new products with a data lake on AWS and Qubole

Présentateur client : Ashish Mrig, responsable principal de l’analytique big data chez TiVo
Présentateur Qubole : Harsh Jetly, architecte de solutions
Présentateur AWS : Paul Sears, architecte de solutions

En savoir plus

Démarrage rapide AWS

Voir l’annonce AWS Marketplace

Qubole logo in blue and black text on a white background.

Talend

Découvrez comment réduire les délais de développement et innover sur AWS. Dans ce webinaire, Beachbody, fournisseur de vidéos d’exercices à domicile pour le fitness, la perte de poids et la musculation, revient sur son expérience de migration vers une architecture de lac de données sur AWS avec Talend. Beachbody expliquera comment l’entreprise a créé une plateforme de données d’entreprise ouverte, qui permet à ses employés d’accéder à des données sécurisées et bien gouvernées, tout en améliorant l’efficacité DevOps à l’échelle de l’entreprise.

Participez à notre webinaire et découvrez comment Talend et AWS ont aidé Beachbody à migrer diverses sources de données non structurées et structurées vers un lac de données, à raccourcir les cycles de développement et de test, et à résoudre les difficultés de déploiement complexes courantes avec les données en temps réel.

Titre du webinaire : Architecting an Open Data Lake for the Enterprise
Présentateur Talend : Ashwin Viswanath, directeur du marketing produit cloud
Présentateur client : Eric Anderson, directeur exécutif responsable des données chez Beachbody
Présentateur AWS : Pratap Ramamurthy, architecte de solutions

En savoir plus

Lire l’étude de cas Beachbody

Télécharger la présentation de la solution

Talend logo featuring a blue wordmark with a yellow and blue sphere icon with connecting lines, on a transparent background.

Informatica

La solution Informatica Intelligent Data Lake Management vous permet d’ingérer, de nettoyer, de traiter, de gouverner et de sécuriser de grands volumes de données brutes dans un lac de données fiable sur AWS. L’IA pilotée par les métadonnées et les capacités de catalogage d’entreprise d’Informatica permettent aux parties prenantes métier, comme les analystes, de découvrir, profiler, préparer et sécuriser rapidement les données afin d’obtenir en temps utile des informations métier pertinentes. En résumé, Informatica permet aux entreprises d’exploiter la puissance d’un lac de données sur AWS et de libérer des informations sur le big data qui contribuent à stimuler l’innovation et les ventes.

Lire le livre blanc

Voir le webinaire à la demande

Informatica company logo, 2017 version, with orange geometric icon and Informatica text.

Looker

Les entreprises d’aujourd’hui reposent sur le big data, et les métriques générées par ces données doivent être définies de manière centralisée et largement accessibles pour apporter une réelle valeur. C’est là qu’intervient Looker, une plateforme de données moderne qui permet à chaque personne dans l’entreprise de trouver et d’explorer les données dont elle a besoin pour prendre des décisions. Looker est conçu pour les plateformes cloud comme Amazon Web Services (AWS) et vous permet d’interroger directement des bases de données cloud modernes, comme les lacs de données. Les clients utilisent Looker pour l’analytique interne, mais aussi pour mettre des données à disposition de leurs clients, partenaires et fournisseurs.

Lire l’article de blog

Voir l’annonce AWS Marketplace

The Looker logo featuring stylized purple bubbles and black text.

Partenaires de conseil APN présentés

Simplifiez le déploiement d’un lac de données basé sur le cloud avec AWS et Talend.

Cognizant logo in a horizontal layout, featuring the company name and graphic icon.

Gagnez en sérénité grâce au processus éprouvé en trois étapes de Cloudwick pour concevoir et gérer des lacs de données sur AWS.

Cloudwick logo with blue text on a white background

Appuyez-vous sur l’expérience de NorthBay et sur son alignement étroit avec AWS pour créer votre solution de lac de données personnalisée.

NorthBay company logo featuring the word 'NorthBay' with a blue triangle incorporated into the letter 'o'.