Le Blog Amazon Web Services

Le Big Data, une opportunité pour les utilisateurs du Cloud

« Big Data » est un terme relativement récent, et qui a connu une popularité fulgurante, au point d’être omniprésent dans l’actualité IT ces 2 dernières années. Le sujet est désormais régulièrement traité par les medias grand public, y compris au journal télévisé. Mais comment en tirer avantage ? Comment le cloud computing peut-il vous aider ?

On peut définir le « Big Data » comme étant la capacité à collecter, stocker et traiter une quantité très importante de données, de formats souvent différents, pour en extraire des informations à forte valeur ajoutée.

Le Cloud, outil de collecte de données

Si le Big Data a pu éclore, c’est d’abord une question de changement d’échelle. A cet égard, plusieurs phénomènes sont venus changer la donne : l’invention de nouvelles technologies (notamment mobiles) et de nouveaux terminaux adoptés par un très large public, l’avènement des réseaux sociaux, etc. Les nouveaux terminaux mobiles sont en effet à l’origine d’une quantité de données si phénoménale qu’il est difficile de l’imaginer. En 2020, IDC (International Data Corporation) estime que la quantité de données générée sera de 40 Zo (Zetta Octets), soit 57 fois supérieure au nombre de grains de sable à la surface de la Terre !

Ce phénomène est amplifié par l’arrivée des objets connectés. Ceux-ci ne sont plus des terminaux conçus spécifiquement pour la communication, mais des objets ayant une fonction originelle propre (détecteur de fumée, de présence, électroménager,…) à laquelle on a ajouté la capacité à collecter et à transmettre de l’information. C’est la naissance de l’Internet des Objets, ou « Internet of Things » (IoT). Grâce à cette explosion d’objets mobiles et connectés, de nombreuses entreprises, quelle que soit leur taille, sont désormais en mesure de recueillir un volume croissant de données.

Le Cloud, outil de stockage des données

Avoir beaucoup de données c’est très bien, mais il faut pouvoir les stocker et les traiter correctement pour en tirer le maximum de valeur. En utilisant le Cloud, les entreprises peuvent désormais centraliser un grand volume de données émanant des réseaux sociaux, de leurs différentes filiales, de leurs points de vente, ou d’une multitude d’utilisateurs disséminés dans différents pays. Et ceci pour un coût relativement faible, sans nécessité d’investir lourdement dans des infrastructures, l’un des avantages intrinsèques du Cloud computing.

Ainsi, si votre approche consiste à stocker autant de données que possible et de tout mesurer, vous aurez besoin d’une très grande quantité de stockage. Dans le cloud, le stockage est scalable, durable, hautement disponible et surtout très économique. Un autre avantage du stockage cloud est qu’il sert également de source de données, au plus près des ressources de calcul destinées à les analyser. Ainsi, il devient inutile de déplacer les données périodiquement, ce qui réduit également la latence des traitements.  De plus, stocker ses données dans le cloud en facilite le partage avec des partenaires ou des tiers, puisqu’ils peuvent également y accéder à toute heure et de partout, en profitant des mêmes ressources à la demande et en payant à l’usage pour extraire et traiter les données.

De ce fait, même si le Big Data était plutôt l’apanage des grands comptes et des entreprises internationales, rien n’interdit désormais de le voir se développer vers les PME – ETI.

Le Cloud,outil de traitement des données

Parmi les principales difficultés pour mener efficacement des analyses Big Data, on peut mentionner l’installation et la gestion du matériel, la capacité à scaler à la hausse ou à la baisse de manière élastique et la consolidation de données provenant de sources multiples. De plus, les systèmes de traitement de données doivent permettre l’expérimentation à faible coût, car les questions que vous allez poser à vos données vont probablement évoluer dans le temps.

Avec le Cloud chaque développeur et chaque entreprise ont le pouvoir de réaliser des analyses complexes sans qu’il soit nécessaire de réaliser de lourds investissements. Aujourd’hui, il est notamment possible de démarrer un cluster Hadoop dans le cloud en quelques minutes, en utilisant les dernières générations de matériel à haute performance sans avoir à les acheter. Les organisations ont ainsi la capacité d’accroître et de réduire un cluster à la demande : si elles ont besoin d’obtenir une réponse plus vite, elles peuvent immédiatement augmenter la taille du cluster afin d’analyser les données plus rapidement.

Un exemple d’exploitation Big Data avec le Cloud AWS : IVIDATA

Fondée à la fin de l’année 2013 et comptant aujourd’hui 60 employés, Ividata est une start-up parisienne spécialisée dans le Big Data. La société avait commencé par utiliser un certain nombre de fournisseurs PaaS pour alimenter son infrastructure. Ividata a cependant vite dû faire face à des coûts vertigineux et à des obstacles techniques liés au traitement des données.

90% taux de compression

S3 permet d’appliquer un taux de compression de 90%, qui ne depasse pas 5$ par mois
Les importantes économies que réalise la société depuis sa migration réussie vers AWS lui permettent de gagner en agilité et d’investir davantage dans l’innovation. Stanley Burks, d’Ividata, déclare : « Auparavant, le stockage d’un téraoctet de données de localisation nous coûtait 5 000 $ par mois. Avec Amazon S3, qui nous permet d’appliquer un taux de compression de 90%, ce stockage ne coûte plus que 5 $ par mois. Ce service est 1 000 fois plus rentable que notre solution préalable, ce qui réduit considérablement nos coûts d’exploitation ».

Cependant, les avantages financiers d’AWS ne se limitent pas au stockage de données. « Le fonctionnement de nos serveurs Web sur AWS Elastic Beanstalk est maintenant environ quatre fois plus économique que sur notre solution PaaS, le coût mensuel ayant baissé de 125 $ à 30 $. Alliée à nos économies en matière de stockage de données, cette réduction a eu un effet immédiat sur notre flexibilité, car nos coûts sont maintenant beaucoup plus faibles ».

AWS fournit également à Ividata l’évolutivité dont elle a besoin pour exploiter de nouvelles opportunités, ce qui a un effet direct sur sa compétitivité sur un marché qui dépend de l’innovation dans les services pour fidéliser et attirer les clients. « Nous pouvons traiter de bien plus gros volumes de données et pouvons également développer nos activités de manière beaucoup plus fiable. En conséquence, nous pouvons maintenant offrir certaines parties de notre service gratuitement aux clients souhaitant faire un essai, afin de constater les bénéfices de notre solution sans s’engager immédiatement sur le plan contractuel. Nous n’avions tout simplement pas la capacité ni la souplesse pour le faire avant. »

Nous vous invitons à découvrir le cas client IVIDATA / AWS plus en détails.