Amazon.com es el minorista online más grande del mundo. En 2011, Amazon.com pasó de utilizar el backup en cinta a usar Amazon Simple Storage Service (Amazon S3) para realizar backups de la mayoría de las bases de datos de Oracle de las que se encarga. Esta estrategia reduce la complejidad y el desembolso de capital, ofrece un desempeño de backup y restauración más rápido, elimina la planificación de capacidad de cinta para las backups y el archivo, y permite que el personal administrativo se dedique a operaciones de más valor. Gracias a esto, la empresa pudo reemplazar su infraestructura de cinta para backups por un tipo de almacenamiento de Amazon S3 basado en la cloud y eliminar el software necesario para los backups. Asimismo, experimentó una mejora del desempeño 12 veces mayor, de forma que pudo reducir el tiempo de restablecimiento de 15 a 2,5 horas aproximadamente en situaciones concretas.

A medida que crece Amazon.com, también aumenta el tamaño de las bases de datos de Oracle y la enorme cantidad de bases de datos que mantienen. Esto ha generado cada vez más problemas relacionados con la realización de backups de las bases de datos existentes de Oracle en cintas, por lo que se han contemplado estrategias alternativas como la utilización de los servicios de la cloud de Amazon Web Services (AWS), una subsidiaria de Amazon.com. Entre los retos empresariales a los que se enfrenta Amazon.com destacan:

  • La planificación de uso y capacidad resulta compleja, y el tiempo y el presupuesto de inversión de capital son de suma importancia. Con los años se necesitaron importantes inversiones de capital para hardware de cinta, espacios de centros de datos para dicho hardware y gastos de licencias empresariales para software de cinta. Durante dicho periodo, la administración de la infraestructura de cinta requería contar con personal altamente cualificado dedicado a la configuración, certificación e ingeniería de la planificación de archivado, en lugar de dedicarse a proyectos de mayor valor. Y, al final de cada ejercicio fiscal, prever los futuros requisitos de capacidad requería auditorías, previsiones y elaboración de presupuestos que consumían mucho tiempo.
  • El costo del software de backup necesario para varios dispositivos de cinta podía ser toda una sorpresa. Los robots de cintas ofrecen una capacidad básica de lectura/escritura, pero para poder utilizarlos completamente, es necesario invertir en software de backup en cinta patentado. Para Amazon.com, el costo del software había sido alto y constituía una parte importante de los costos generales de backup. El costo de este software no dejaba de plantear un problema en los presupuestos, pero resultaba difícil de solucionar debido a que era necesario grabar los backups en dispositivos de cinta.
  • Mantener backups de confianza y disfrutar de rapidez y eficacia al recuperar los datos son tareas que requieren mucho tiempo y esfuerzo con la cinta. Si los datos tienen que almacenarse de manera duradera en la cinta, es necesario realizar varias copias. Si todo funciona correctamente y existe una contención mínima de los recursos de cinta, los robots de cinta y el software de backup pueden encontrar los datos necesarios con facilidad. No obstante, si el hardware falla, se precisa de la intervención humana para restablecer los datos desde la cinta. La contención de las unidades de cinta derivada de solicitudes de cinta de varios usuarios ralentiza todavía más los procesos de restablecimiento. Esto afecta al objetivo de tiempo de recuperación (RTO) y hace que conseguirlo sea más complicado que con las backups almacenadas en la cloud.

Amazon.com empezó a evaluar Amazon S3 para poder introducir mejoras económicas y de desempeño en el ámbito de la backup de los datos. Como parte de dicha evaluación, estudiaron los aspectos de seguridad, disponibilidad y desempeño de las backups de Amazon S3. Amazon.com también realizó un análisis costo-beneficio para garantizar que la migración a Amazon S3 merecía la pena desde el punto de vista económico. Este análisis costo-beneficio comprendía los siguientes elementos:

  • Ventajas de desempeño y competitividad de los costos. Era importante que los costos generales de los backups no aumentaran. Al mismo tiempo, Amazon.com precisaba de un desempeño más rápido para backups y recuperaciones. El tiempo y el esfuerzo necesarios para las operaciones de backup y recuperación demostraron ser una mejora importante con respecto a la cinta, ya que el restablecimientos desde Amazon S3 se ejecutaba de dos a doce veces más rápido que un restablecimiento similar desde la cinta. Amazon.com necesitaba un nuevo método de backup para ofrecer más desempeño y, al mismo tiempo, mantener o reducir los costos generales. Los backups en discos on-premise hubieran mejorado el desempeño, pero hubiesen supuesto pérdidas en relación con la competitividad de los costos. El almacenamiento basado en la cloud de Amazon S3 cumplía los dos criterios.
  • Mayor durabilidad y disponibilidad. Amazon S3 está diseñado para ofrecer una durabilidad del 99,999999999% y una disponibilidad de los objetos del 99,99% durante un año concreto. Amazon.com comparó estas cifras con las de la infraestructura de la cinta, tras lo cual determinó que Amazon S3 ofrecía una mejora importante.
  • Menor fricción operativa. Los administradores de bases de datos de Amazon.com tuvieron que evaluar si las backups de Amazon S3 serían viables para las backups de las bases de datos. Determinaron que utilizar Amazon S3 para las backups resultaba fácil de implementar ya que funcionaba perfectamente con Oracle RMAN.
  • Seguridad de los datos potente. Amazon.com observó que AWS cumplía todos los requisitos de seguridad física, acreditaciones de seguridad y procesos de seguridad, protegía los datos activos e inactivos y utilizaba los estándares de cifrado adecuados.

Durante todo el proceso de migración a Amazon S3, Amazon.com ha obtenido varios beneficios, entre los que se incluyen:

  • Eliminación de una planificación compleja de la capacidad de cinta que tanto tiempo requería. Amazon.com crece de manera más acuciante y dinámica cada año, tanto orgánicamente como a raíz de sus adquisiciones. AWS ha permitido a Amazon.com seguir el ritmo perfectamente de esta rápida expansión. Anteriormente, los grupos empresariales de Amazon.com tenían que elaborar planes de backups anuales, en los que cuantificaban el volumen de almacenamiento en cinta que pretendían utilizar a lo largo del año y la frecuencia con la que utilizarían los recursos de cinta. Estos planes se utilizan para cobrar a cada organización por el uso que hacen de las cintas, para lo que se reparte el costo entre muchos equipos. Con Amazon S3, los equipos solo tienen que pagar por lo que utilizan. Se les facturará según el uso que hayan realizado. Prácticamente no existe ningún límite máximo en cuanto a la cantidad de datos que se pueden almacenar en Amazon S3, por lo que no es necesario preocuparse por agotar los recursos. Para los equipos que hayan adoptado los backups de Amazon S3, la necesidad de realizar una planificación formal se ha eliminado prácticamente.
  • Menos inversiones de capital. Amazon.com ya no necesita adquirir robots de cinta, unidades de cinta, inventarios de cinta, espacio para centros de datos, dispositivos de red o software para backup empresarial ni prever el futuro consumo de cinta. De esta forma, se elimina el problema de tener que presupuestar con mucha antelación los bienes de equipo y los gastos de capital.
  • Disponibilidad inmediata de los datos para su restablecimiento, sin necesidad de localizar ni de recuperar cintas físicas. Los administradores de bases de datos siempre experimentan retrasos cuando tienen que restablecer datos desde cintas. El software de backup de la cinta tiene que leer el catálogo de la cinta para encontrar los archivos correctos que se van a restablecer, localizar la cinta correcta, montar la cinta y leer los datos que esta contiene. En casi todos los casos, los datos se distribuyen entre varias cintas, lo que provoca aún más retrasos. Esto, sumado a la contención de las unidades de cinta a raíz de solicitudes de cinta realizadas por varios usuarios, ralentiza el proceso todavía más. Esto resulta especialmente grave durante eventos de vital importancia como la interrupción de un centro de datos, donde es necesario restablecer muchas bases de datos al mismo tiempo y lo antes posible. Ninguno de estos problemas se producen con Amazon S3. Los restablecimientos de datos pueden comenzar de inmediato, sin necesidad de esperar ni de soportar las colas de las cintas, lo que significa que la base de datos se puede restablecer mucho más rápido.
  • El backup de una base de datos en Amazon S3 puede realizarse de dos a doce veces más rápido que con unidades de cinta. Por ejemplo, en una prueba de referencia, un administrador de base de datos pudo restablecer 3,8 terabytes en 2,5 horas a través de Gigabit Ethernet. Esto asciende a 25 gigabytes por minuto, o 422 MB por segundo. Además, habida cuenta de que Amazon.com utiliza la compresión de datos RMAN, la tasa de restablecimiento efectiva ascendió a 3,37 gigabytes por segundo. Estas 2,5 horas se comparan con el periodo habitual de 10 a 15 horas que hubiera sido necesario con una cinta.
  • Sencilla implementación de las backups de Oracle RMAN en Amazon S3. A los administradores de bases de datos les resultó sencillo iniciar los backups de sus bases de datos en Amazon S3. Para direccionar las backups de Oracle RMAN a Amazon S3 solo es necesario realizar una configuración del módulo Oracle Secure Backup Cloud (SBC). El trabajo necesario para configurar el módulo Oracle SBC supuso una hora o menos por cada base de datos. Después de esta configuración puntual, los backups de las bases de datos se redireccionaron de manera transparente a Amazon S3.
  • Amazon S3 ofrece un almacenamiento de los datos a muy largo plazo, dado que es un servicio diseñado para ofrecer una durabilidad del 99,9999999%. En ocasiones, Amazon.com ha experimentado errores de hardware con la infraestructura de cinta debido a que las cintas se rompen, las unidades de cinta fallan y los componentes robóticos fallan. En ocasiones, esto sucede cuando un administrador de base de datos intenta restablecer una base de datos y, con ello, provoca que aumente significativamente el tiempo medio de recuperación (MTTR). Con la durabilidad y disponibilidad de Amazon S3, estos problemas desaparecen.
  • Liberación de recursos humanos importantes. Con la infraestructura de cinta, Amazon.com tenía que recurrir a ingenieros expertos en instalaciones muy grandes de backups en cinta, que deben reunir una serie de cualidades especializadas y específicas del proveedor que resultan difíciles de encontrar. También tenían que contratar técnicos de centros de datos que se dedicaran a solucionar problemas de hardware y generales, como sustituir las unidades, transferir las cintas, entregar y hacer un seguimiento de las cintas, etc. Amazon S3 permitió a estos profesionales liberarse de las operaciones diarias para que pudieran centrarse en desarrollar tareas de ingeniería más importantes y críticas para la empresa.
  • Eliminación del transporte de cintas físicas a ubicaciones remotas. Las empresas que hayan almacenado de manera remota los datos de backup de Oracle deberían analizar detenidamente los costos relacionados con el transporte, la protección y el almacenamiento de las cintas en ubicaciones remotas, ya que estos costos pueden reducirse o quizá eliminarse con el almacenamiento de los datos en Amazon S3.

Como el minorista online más importante del mundo, Amazon.com busca innovar constantemente a fin de ofrecer mejores experiencias a los clientes y ofrecer productos al precio más bajo posible. Una de tales innovaciones ha sido reemplazar la cinta por el almacenamiento en Amazon S3 para los backups de las bases de datos. Se trata de una innovación que pueden replicar fácilmente otras organizaciones que utilizan la cinta para realizar backups de bases de datos de Oracle.

Para obtener más información sobre los backups y el almacenamiento de AWS, visite: http://aws.amazon.com/backup-storage/.