Le Big Data peut être décrit en termes de défis en matière de gestion de données qui, en raison de la vitesse, de la variété et du volume croissants des données, ne peuvent être relevés avec les bases de données traditionnelles. Bien qu'il y ait de nombreuses définitions pour l'expression Big Data, la plupart d'entre elles comprennent un concept généralement connu sous le nom des « trois V » du Big Data :

Volume : peut varier de quelques téraoctets à plusieurs pétaoctets de données

Variété : comprend des données provenant de différentes sources et se présentant sous divers formats (par ex., pages web, fichiers journaux, interactions avec les réseaux sociaux, eCommerce et transactions en ligne, transactions financières, etc.)

Vitesse : les exigences des entreprises sont de plus en plus strictes, entre le moment où les données sont générées et le moment où des informations décisionnelles sont transmises aux utilisateurs. Par conséquent, les données doivent être collectées, stockées, traitées et analysées dans des délais relativement courts, le processus pouvant aller d'une journée à un traitement en temps réel


Malgré l'intérêt que suscite le Big Data, de nombreuses organisations ne se rendent pas compte qu'elles sont confrontées à un problème lié à cette technologie ou n'y réfléchissent tout simplement pas dans cette perspective. En général, une organisation devrait pouvoir profiter des technologies Big Data lorsque les bases de données et les applications existantes ne peuvent plus s'adapter pour assurer le support de l'augmentation soudaine du volume, de la variété et de la vitesse des données.

Si une organisation ne relève pas correctement les défis liés au Big Data, elle s'expose à une forte augmentation des coûts ainsi qu'à une baisse de la productivité et de la compétitivité. Par ailleurs, une stratégie efficace en matière de Big Data peut aider les organisations à réduire les coûts et à améliorer leur efficacité opérationnelle en migrant les charges de travail existantes les plus lourdes vers des technologies Big Data, et en déployant de nouvelles applications pour profiter de nouvelles opportunités.


BigData__hadoop

Grâce aux nouveaux outils couvrant l'ensemble du cycle de gestion des données, les technologies Big Data constituent une façon rentable, sur le plan technique comme économique, non seulement de collecter et de stocker des ensembles de données plus larges, mais aussi de les analyser pour mettre en évidence de nouvelles informations et des connaissances précieuses. Dans la plupart des cas, le traitement du Big Data implique un flux de données commun, de la collecte de données brutes à l'utilisation d'informations décisionnelles.

Collectez. La collecte de données brutes (transactions, fichiers journaux, appareils mobiles, etc.) est le premier défi que de nombreuses organisations doivent relever lors du traitement de Big Data. Une plateforme de Big Data efficace facilite cette étape, en permettant aux développeurs d'absorber une grande variété de données, structurées ou non, à n'importe quelle vitesse, que ce soit en temps réel ou par lot.

Stockez. Toute plate-forme de Big Data a besoin d'un référentiel sécurisé, évolutif et durable pour stocker les données avant ou même après les tâches de traitement. En fonction de vos besoins spécifiques, vous aurez peut-être aussi besoin de stockage temporaire pour les données en transit.

Traitez et analysez. Lors de cette étape, les données passent d'un état brut à un format consommable, généralement grâce à un processus de tri, d'agrégation et d'association, et même grâce à l'exécution de fonctions et d'algorithmes plus avancés. Les ensembles de données ainsi obtenus sont ensuite stockés en vue d'un traitement ultérieur ou mis à disposition pour être utilisés via des outils d'informatique décisionnelle et de visualisation de données.

Consommez et visualisez. Le Big Data consiste surtout à extraire des informations précieuses et décisionnelles de vos données. Dans l'idéal, les données sont mises à la disposition des parties prenantes via des outils d'informatique décisionnelle et de visualisation de données flexibles et en libre-service, et qui permettent d'explorer rapidement et facilement des ensembles de données. En fonction du type d'analyse, les utilisateurs finaux peuvent également utiliser les données sous la forme de « prédictions » statistiques (dans le cas de l'analyse prédictive) ou de mesures recommandées (dans le cas de l'analyse prescriptive).


L'écosystème Big Data continue d'évoluer à une vitesse impressionnante. Aujourd'hui, différents styles d'analyse supportent plusieurs fonctions au sein de l'organisation.

BigData__collection-processing

L'analysedescriptive aide les utilisateurs à répondre à la question suivante : « Que s'est-il passé et pourquoi ? » Les exemples comprennent les environnements traditionnels de requête et de rapport, avec des tableaux d'affichage et des tableaux de bord.

L'analyse prédictive permet aux utilisateurs d'estimer la probabilité qu'un événement donné se produise dans le futur. Elle comprend notamment les systèmes d'alerte précoce, les mesures de détection des fraudes, les applications de maintenance préventive et les prévisions.

L'analyse prescriptive fournit des recommandations (prescriptives) spécifiques à l'utilisateur. Elle répond à la question suivante : Que faire si l'événement « x » se produit ?

Au départ, les frameworks Big Data tels qu'Hadoop, supportaient uniquement les charges de travail en lot, tandis que les larges ensembles de données étaient traités en masse pendant un créneau défini, généralement mesuré en heures, si ce n'est en jours. Cependant, à mesure que les procédures de travail gagnaient en importance, la « vitesse » du Big Data a favorisé l'évolution de nouveaux frameworks tels qu'Apache Spark, Apache Kafka, Amazon Kinesis et d'autres, pour supporter le traitement en temps réel et en streaming des données.


Amazon Web Services vous propose un portefeuille complet et entièrement intégré de services de cloud computing pour vous aider à créer, protéger et déployer vos applications Big Data. Avec AWS, vous n'avez aucun matériel à acheter ni aucune infrastructure à entretenir et à faire évoluer. Vous pouvez donc vous concentrer sur vos ressources pour acquérir de nouvelles informations. Grâce aux nouvelles capacités et fonctionnalités constamment proposées par AWS, vous pourrez toujours profiter des dernières technologies sans engagement ni investissement à long terme.

En savoir plus sur la plate-forme et les outils Big Data d'AWS

Disponibilité immédiate

La plupart des technologies Big Data nécessitent de larges clusters de serveurs, ce qui génère de longs cycles de configuration et de mise en service. Avec AWS, vous pouvez déployer l'infrastructure dont vous avez besoin presque instantanément. Vos équipes peuvent donc être plus productives, il vous est plus facile d'innover et les projets sont déployés plus rapidement.

Des capacités étendues et variées

Les charges de travail Big Data sont aussi variées que les données qu'elles sont destinées à analyser. Une vaste plate-forme vous permet de créer pratiquement toutes les applications Big Data et de supporter toutes charges de travail, quels que soient le volume, la vitesse et la variété des données. Avec plus de 50 services et des centaines de fonctionnalités ajoutées chaque année, AWS vous fournit tout ce dont vous avez besoin pour collecter, stocker, traiter, analyser et visualiser le Big Data dans le cloud. Découvrez la plate-forme Big Data d'AWS.

Fiable et sécurisé

Les données Big Data sont des données sensibles. Par conséquent, il est impératif de protéger vos données et votre infrastructure sans en compromettre l'agilité. AWS met à disposition des installations, réseaux, logiciels et processus métier les capacités nécessaires pour répondre aux exigences les plus strictes. Les environnements sont continuellement audités pour vérifier leurs certifications, notamment ISO 27001, FedRAMP, DoD SRG, et PCI DSS. Les programmes d'assurance vous aident à démontrer la conformité à plus de 20 standards, notamment la loi HIPAA, la norme NCSC, etc. Veuillez consulter le Centre de sécurité dans le cloud pour en savoir plus.

Des centaines de partenaires et de solutions

Un large écosystème de partenaires peut vous aider à combler vos lacunes en termes de compétences et à prendre en main le Big Data encore plus vite. Consultez le réseau de partenaires AWS pour obtenir de l'aide auprès d'un partenaire consultant, ou faites votre choix parmi de nombreux outils et applications dans l'ensemble de la pile de gestion de données.


Laissez-nous vous aider à relever vos défis liés au Big Data. Laissez-nous le soin de nous occuper des tâches fastidieuses. Vous pourrez ainsi consacrer plus de temps et de ressources à la réalisation des objectifs de votre entreprise ou organisation.

En savoir plus sur les solutions Big Data d'AWS