Amazon.com est le plus grand magasin en ligne au monde. En 2011, Amazon.com a remplacé les sauvegardes sur bande magnétique par l'utilisation d'Amazon Simple Storage Service (Amazon S3) pour sauvegarder la majorité de ses bases de données Oracle. Cette stratégie permet de réduire la complexité et les dépenses de capital, tout en assurant des performances plus rapides en matière de sauvegarde et de récupération. Il est désormais inutile de planifier la capacité des bandes magnétiques en vue des sauvegardes et de l'archivage, et le personnel administratif peut se consacrer à des opérations à plus forte valeur ajoutée. L'infrastructure basée sur des bandes magnétiques a donc été remplacée par le stockage dans le cloud avec Amazon S3 : les équipes ont ainsi pu se débarrasser du logiciel de sauvegarde et bénéficier de performances 12 fois supérieures. Conséquence : une réduction du temps de récupération de 15 heures à 2,5 heures, selon les cas.

La croissance continue d'Amazon.com s'accompagne d'une forte augmentation de la taille de ses bases de données Oracle, ainsi que du nombre de bases de données à gérer. Il est donc apparu de plus en plus difficile de sauvegarder les bases de données Oracle existantes sur bandes, ce qui a conduit à l'étude d'autres stratégies, dont l'utilisation des services dans le cloud d'Amazon Web Services (AWS), une filiale d'Amazon.com. Voici un aperçu des défis auxquels Amazon.com a dû faire face dans le cadre de ses activités :

  • La planification de la capacité et de l'utilisation est une tâche complexe. De plus, le temps consacré et les dépenses d'investissement sont limités. D'importantes dépenses d'investissement ont été affectées, au fil des ans, au matériel de sauvegarde sur bandes, à l'espace alloué aux centres de données et aux frais de licence relatifs aux logiciels associés. Dans le même temps, du personnel hautement qualifié s'est attelé à configurer, certifier et organiser la planification de l'archivage, au lieu de se consacrer à des projets à plus haute valeur ajoutée. A la fin de chaque exercice comptable, il a en outre fallu auditer, planifier et budgétiser les besoins en capacités : autant de tâches particulièrement chronophages.
  • Il est difficile d'anticiper les coûts des logiciels de sauvegarde nécessaires à la prise en charge de plusieurs unités de bande. Les robots de bande offrent une fonctionnalité en lecture/écriture de base. Cependant, pour en tirer pleinement parti, vous devez investir dans des logiciels propriétaires de sauvegarde sur bandes. Dans le cas d'Amazon.com, ces coûts logiciels ont été relativement élevés et ont fait exploser les coûts de sauvegarde globaux. Il s'agissait là d'un problème majeur sur le plan budgétaire, mais dont la résolution s'avérerait difficile aussi longtemps que les sauvegardes devaient être effectuées sur des bandes.
  • Avec les unités de bande, garantir des sauvegardes fiables, tout en permettant une récupération rapide et efficace des données, s'avère à la fois long et complexe. Pour stocker de manière durable des données sur bandes, plusieurs copies sont nécessaires. Lorsque tout fonctionne correctement, et que l'encombrement est minime au niveau des ressources de bande, les robots et les logiciels de sauvegarde peuvent localiser aisément les données requises. Cependant, en cas de défaillance matérielle, une intervention humaine est nécessaire pour restaurer les données à partir des bandes. Dans le cas des lecteurs de bande, l'encombrement résultant des requêtes émises par plusieurs utilisateurs ralentit encore davantage les processus de restauration. Cela a pour effet de peser sur la durée maximale d'interruption admissible ou RTO (Recovery Time Objective) et de rendre sa réalisation encore plus difficile par rapport à la sauvegarde sur un espace de stockage dans le cloud.

Amazon.com a commencé à évaluer Amazon S3 en vue d'améliorer la sauvegarde de ses données sur le plan économique et en termes de performances. Dans cette optique, la sécurité, la disponibilité et les performances des sauvegardes Amazon S3 ont été prises en compte. Amazon.com a également réalisé une analyse coût/bénéfice pour s'assurer de l'opportunité d'une migration vers Amazon S3 d'un point de vue financier. Cette analyse a pris en compte les éléments suivants :

  • Avantage en termes de performances et compétitivité des coûts. Il était important de veiller à ce que le coût total des sauvegardes n'augmente pas. Dans le même temps, Amazon.com souhaitait améliorer les performances de sauvegarde et de récupération. Dans la pratique, les opérations de sauvegarde et de récupération ont enregistré une amélioration sensible des performances par rapport aux unités de bande. La restauration à partir d'Amazon S3 s'est ainsi révélée être entre deux et douze fois plus rapide qu'une opération similaire sur bande ! Pour Amazon.com, le nouveau support de sauvegarde se devait d'être plus performant, sans pour autant augmenter les coûts. Utiliser l'infrastructure de stockage sur disques en interne pour effectuer des sauvegardes aurait certes permis d'atteindre l'objectif de performances, mais pas celui de compétitivité des coûts. Avec la solution de stockage dans le cloud Amazon S3, en revanche, les deux objectifs étaient atteints.
  • Durabilité et disponibilité accrues des données. Amazon S3 est conçu pour fournir une durabilité de 99,999999999 % et une disponibilité des objets de 99,99 % sur une période d'un an. En comparant ces chiffres à ceux obtenus avec son infrastructure sur bandes, Amazon.com a déterminé que la solution Amazon S3 présentait des avantages significatifs.
  • Moins de friction opérationnelle. Les administrateurs de base de données d'Amazon.com ont dû évaluer la viabilité des sauvegardes Amazon S3 pour leurs sauvegardes de base de données. Ils ont déterminé que la mise en œuvre d'Amazon S3 pour les sauvegardes était facilitée par son utilisation transparente avec l'outil RMAN d'Oracle.
  • Sécurité des données renforcée. Sur la base des analyses réalisées, il est apparu qu'AWS répondait à l'ensemble des besoins exprimés par Amazon.com sur le plan de la sécurité physique, ainsi que des accréditations et des processus de sécurité, protégeant les données en transit et au repos, tout en utilisant des normes de chiffrement adaptées.

La migration vers Amazon S3 s'est accompagnée de plusieurs avantages pour Amazon.com. En voici un aperçu :

  • Suppression de la planification de la capacité sur bande, une procédure à la fois longue et complexe. Chaque année, Amazon.com s'étend et devient plus dynamique, que cela soit dû à une évolution naturelle ou le résultat d'acquisitions diverses. AWS a permis à Amazon.com de suivre ce rythme d'expansion effréné et ce, sans aucune difficulté. Traditionnellement, les entités d'Amazon.com devaient rédiger leurs plans de sauvegarde annuels, en quantifiant le volume de stockage sur bandes qu'elles prévoyaient d'utiliser sur l'année, ainsi que la fréquence d'utilisation des ressources sur bande. Ces plans servaient ensuite à facturer l'utilisation des unités de bande à chaque organisation, répartissant ainsi les coûts entre de nombreuses équipes. Avec Amazon S3, les équipes paient simplement pour ce qu'elles utilisent et sont facturées en fonction de l'utilisation. La quantité de données qu'il est possible de stocker dans Amazon S3 étant virtuellement illimitée, il n'y a plus aucun risque de tomber à court de ressources. Pour les équipes qui adoptent les sauvegardes Amazon S3, on peut considérer que la planification formelle appartient désormais au passé.
  • Réduction des dépenses d'investissement. Amazon.com ne doit plus acheter de robots de bande, de lecteurs de bande, de solutions d'inventaire de bande, d'espace pour les centres de données, d'équipements réseau, de logiciels de sauvegarde d'entreprise, ni même prévoir les besoins en matière d'utilisation de bandes. Cela a pour effet d'éliminer toute budgétisation des immobilisations matérielles, ainsi que les dépenses d'investissement.
  • Disponibilité immédiate des données en vue de la restauration. Il est donc inutile de localiser ou de récupérer des bandes physiques ! Pour les administrateurs, les retards sont inhérents à la procédure de restauration des données à partir d'une bande. Le logiciel de sauvegarde sur bandes doit lire le catalogue de bandes pour trouver les fichiers corrects à restaurer, localiser la bande appropriée, la monter, puis lire les données qui y sont stockées. Dans pratiquement tous les cas, les données sont disséminées sur plusieurs bandes, ce qui entraîne des retards supplémentaires. Si l'on y ajoute l'encombrement résultant des requêtes émises par plusieurs utilisateurs, les opérations s'en trouvent encore plus ralenties. Cela s'avère d'autant plus grave lors d'événements critiques, tels que la défaillance d'un centre de données, lorsque de nombreuses bases de données doivent être restaurées simultanément et dans les plus brefs délais. Aucun de ces problèmes ne survient avec Amazon S3. Les restaurations de données peuvent démarrer immédiatement, sans aucun temps d'attente, ni mise en file d'attente des bandes, ce qui se traduit par une récupération beaucoup plus rapide de la base de données.
  • La sauvegarde d'une base de données sur Amazon S3 peut se révéler de deux à douze fois plus rapide qu'avec des lecteurs de bande. Au cours d'un banc d'essai, un administrateur de base de données est ainsi parvenu à restaurer 3,8 To de données en 2,5 heures sur une connexion Gigabit Ethernet ; soit 25 giga-octets par minute ou 422 Mo par seconde. De plus, étant donné qu'Amazon.com utilise la compression de données RMAN, le débit de restauration effectif était de 3,37 Go par seconde ! Dans le cas d'une restauration à partir d'une bande, cette même opération aurait demandé, au bas mot, entre 10 et 15 heures.
  • Mise en œuvre aisée de sauvegardes Oracle RMAN sur Amazon S3. Les administrateurs ont pu commencer à sauvegarder, sans peine, leurs bases de données sur Amazon S3. Pour diriger les sauvegardes Oracle RMAN vers Amazon S3, il suffit de procéder à une configuration du module Oracle SBC (Secure Backup Cloud). La configuration du module Oracle SBC a demandé une heure, voire moins, par base de données. A l'issue de cette configuration unique, les sauvegardes de base de données ont été redirigées, de manière transparente, vers Amazon S3.
  • Amazon S3, une durabilité du stockage des données de 99,999999999 % (« 11 neuf »). L'infrastructure de bandes d'Amazon.com a déjà fait l'objet de défaillances matérielles : rupture de bandes, panne des lecteurs de bande ou encore défaillance des composants robotiques. Parfois, cela se produit alors que l'administrateur tente de restaurer une base de données, ce qui allonge sensiblement le délai moyen de récupération (MTTR). Avec la durabilité et la disponibilité d'Amazon S3, ces problèmes appartiennent définitivement au passé.
  • Affectation de la main-d'œuvre à des tâches plus importantes. Avec l'infrastructure de bandes, Amazon.com devait s'adresser à des ingénieurs rompus à la gestion de très grandes installations de sauvegarde sur bandes ; une main-d'œuvre spécialisée particulièrement difficile à dénicher ! Il fallait également engager des techniciens pour les centres de données, et les affecter à la résolution des problèmes et des pannes matérielles (remplacement de lecteurs, déplacement de bandes, expédition et suivi des bandes, etc.). Amazon S3 a permis d'affranchir ces spécialistes des opérations quotidiennes et de les affecter à des tâches d'ingénierie critiques plus ciblées.
  • Elimination du transport de bandes physiques hors site. Les sociétés qui stockent des données de sauvegarde Oracle hors site devraient examiner attentivement les coûts induits par le transport, la protection et le stockage des bandes. Ces coûts peuvent être éliminés, voire supprimés, en stockant les données dans Amazon S3.

En sa qualité de plus grand magasin en ligne au monde, Amazon.com ne cesse d'innover afin d'améliorer l'expérience client et de proposer des produits aux prix les plus bas. C'est dans cette optique que l'infrastructure de sauvegarde sur bandes a été remplacée par la solution de stockage Amazon S3 pour les sauvegardes de base de données. Cette approche innovante peut être facilement reproduite par d'autres organisations qui sauvegardent leurs bases de données Oracle sur bandes.

Pour en savoir plus sur les sauvegardes et le stockage sur AWS, consultez la page : http://aws.amazon.com/backup-storage/.