A Amazon.com é a maior varejista on-line do mundo. Em 2011, a Amazon.com passou do backup em fita para a utilização do Amazon Simple Storage Service (Amazon S3) para fazer o backup da maior parte de seus bancos de dados Oracle. Essa estratégia reduz a complexidade e as despesas de capital, fornece um desempenho mais rápido de backup e restauração, elimina necessidade de planejamento de capacidade de fita para backup e arquivamento, e permite que os funcionários administrativos fiquem livres para realizar operações mais importantes. Foi possível substituir a infraestrutura de backup em fita pelo armazenamento com base em nuvem do Amazon S3, eliminar o software de backup e obter um desempenho 12 vezes melhor, reduzindo o tempo de restauração de cerca de 15 horas para 2,5 horas em cenários selecionados.

À medida que a Amazon.com cresce, o tamanho dos seus bancos de dados Oracle continua a crescer, assim como o grande número de bancos de dados que ela mantêm. Isso tem causado dores crescentes relacionadas ao backup para fita dos bancos de dados Oracle preexistentes e levado em consideração estratégias alternativas incluindo o uso de serviços de nuvem da Amazon Web Services (AWS), uma subsidiária da Amazon.com. Alguns dos desafios comerciais que a Amazon.com enfrentou incluíram:

  • O planejamento de utilização e capacidade é complexo e o orçamento das despesas de capital e tempo é dispendioso. Eram necessárias despesas de capital significativas no decorrer dos anos para o hardware de fita, o espaço de datacenter desse hardware e os gastos com licenciamento corporativo para o software de fita. Durante esse tempo, o gerenciamento da infraestrutura de fita necessitava de equipe altamente habilitada para gastar tempo com configuração, certificação e planejamento do arquivo de engenharia em vez de em projetos de valores maiores. E no fim de cada ano fiscal, projetar a necessidade de capacidade futura exigia auditorias de consumo de tempo, previsão e orçamento.
  • O custo do software de backup necessário para suportar vários dispositivos de fita recai sobre você. Os robôs de fita fornecem recursos de leitura/gravação básicos, mas para utilizá-los completamente, você deve investir em software de backup de fita proprietário. Para a Amazon.com, o custo do software foi alto e agregou significativamente aos custos gerais de backup. O custo desse software era um problema contínuo, mas era algo difícil de resolver já que os backups precisavam ser gravados em dispositivos de fita.
  • Manter backups confiáveis e torná-los mais rápido e eficiente ao recuperar dados requer uma grande quantidade de tempo e esforço com fita. Quando os dados precisam ser armazenados de forma duradoura em fita, várias cópias são necessárias. Quando tudo está trabalhando corretamente, e há contenção mínima para recursos de fita, os robôs de fita e o software de backup podem facilmente encontrar os dados desejados. No entanto, no caso de uma falha de hardware, a intervenção humana é necessária para restaurar a partir da fita. A contenção das unidades de fita resultante das solicitações de fita de vários usuários desacelera os processos de restauração ainda mais. Isso contribui para o recovery time objective (RTO – objetivo do tempo de recuperação) e torna alcançá-lo mais desafiador em comparação com o backup para o armazenamento em nuvem.

A Amazon.com iniciou a avaliação do Amazon S3 pra aprimoramentos econômicos e de performance relacionados ao backup de dados. Como parte dessa avaliação, eles consideraram aspectos de segurança, disponibilidade e performance dos backups do Amazon S3. A Amazon.com também executou uma análise de benefício de custo para assegurar que uma migração para o Amazon S3 seja financeiramente proveitosa. Essa análise do custo-benefício incluiu os seguintes elementos:

  • Vantagem na performance e competitividade de custo. Era importante que os custos gerais dos backups não aumentassem. Ao mesmo tempo, a Amazon.com precisava de performance de backup e recuperação mais rápida. O tempo e esforço necessários para operações de backup e recuperação provaram ser um aprimoramento significativo sobre a fita, com a restauração do Amazon S3 executando de duas a doze vezes mais rápido que uma restauração similar da fita. A Amazon.com precisava de qualquer meio novo de backup para fornecer performance aprimorada enquanto mantinha ou reduzia os custos gerais. Fazer backup do disco no local com base em armazenamento melhorava a performance, mas deixava a desejar em competitividade de custo. O armazenamento baseado no Amazon S3 em nuvem satisfazia a ambos os critérios.
  • Maior durabilidade e disponibilidade. O Amazon S3 é projetado para fornecer uma durabilidade de 99,999999999% e uma disponibilidade de 99.99% de objetos durante um determinado ano. A Amazon.com comparou esses números com os observados na sua infraestrutura de fita e determinou que o Amazon S3 ofereceu aprimoramento significativo.
  • Menos atrito operacional. Os DBAS da Amazon.com tiveram de avaliar se os backups do Amazon S3 seriam viáveis para seus backups de banco de dados. Eles determinaram que usar o Amazon S3 para backup era fácil de implementar porque funcionava de modo imperceptível com o Oracle RMAN.
  • Segurança robusta de dados. A Amazon.com descobriu que a AWS atendia a todas as suas necessidades de segurança física, credenciamentos de segurança e processos de segurança, protegendo dados no ar, dados em repouso e utilizando padrões de criptografia adequados.

Com a migração para o Amazon S3 bem adiantada no caminho para conclusão, a Amazon.com concretizou vários benefícios, incluindo:

  • Eliminação de planejamento de capacidade de fita complexo e demorado. A Amazon.com esta cada vez mais crescendo e dinâmico a cada ano, tanto organicamente quanto como resultado das aquisições. A AWS tem capacitado a Amazon.com a manter o ritmo dessa rápida expansão e a fazer isso de modo imperceptível. Historicamente, os grupos de negócios da Amazon.com tiveram de escrever planos de backup anuais, quantificando o volume de armazenamento em fita que eles planejavam usar para o ano e a frequência com que eles usariam os recursos de fita. Esses planos são usados para cobrar de cada organização pelo uso da fita, distribuindo o custo entre várias equipes. Com o Amazon S3, as equipes simplesmente pagam pelo o que usam e são faturados pela utilização à medida que executam. Praticamente, não há limites superiores de armazenamento de dados no Amazon S3 e, portanto, não há nenhuma preocupação sobre os recursos se esgotarem. Para equipes que adotam os backups do Amazon S3, a necessidade de planejamento formal foi totalmente eliminada.
  • Despesas de capital reduzidas. A Amazon.com não precisa mais adquirir robôs de fita, unidades de fita, estoque de fita, espaço de datacenter, equipamento de redes, software e backup corporativo ou prever o consumo futuro de fita. Isso elimina o ônus de fazer orçamento dos meios de produção com bastante antecedência, bem como das despesas de capital.
  • Disponibilidade imediata dos dados para restauração – se a necessidade de localizar ou recuperar fitas físicas. Sempre que um DBA precisa restaurar os dados da fita, eles enfrentam atrasos. O software de backup de fita precisa ler o catálogo da fita para localizar os arquivos corretos a serem restaurados, localizar a fita correta, montar a fita e ler os dados nela. Em quase todos os casos, os dados estão divididos em várias fitas, resultando em atrasos adicionais. Isso, combinado com a contenção das unidades de fita resultante das solicitações de fita de vários usuários, desacelera o processo ainda mais. Isso é especialmente grave durante eventos críticos como uma interrupção do datacenter, quando muitos bancos de dados devem ser restaurados simultaneamente e o mais rápido possível. Nenhum desses problemas ocorre com o Amazon S3. As restaurações de dados começam imediatamente, sem nenhuma espera ou fila de fita – e isso significa que o banco de dados pode ser recuperado muito mais rapidamente.
  • Fazer backup de um banco de dados para o Amazon S3 pode ser duas a doze vezes mais rápido do que com unidades de fita. Como um exemplo, em um teste de referência, um DBA foi capaz de restaurar 3,8 terabytes em 2,5 horas usando Gigabit Ethernet. Isso equivale a 25 gigabytes por minuto ou 422 MB por segundo. Além disso, como a Amazon.com usa a compactação de dados RMAN, a taxa de restauração efetiva foi de 3,37 gigabytes por segundo. Essas 2,5 horas se comparam às 10 a 15 horas (conservadoramente) que seriam necessárias para restaurar a partir da fita.
  • Implementação fácil de backups do Oracle RMAN para Amazon S3. Os DBAs acharam fácil iniciar o backup dos seus bancos de dados para o Amazon S3. Direcionar os backups do Oracle RMAN para o Amazon S3 requer apenas uma configuração do módulo Oracle SBC (Secure Backup Cloud). O esforço necessário para configurar o módulo Oracle SBC equivalia à uma hora ou menos por banco de dados. Depois dessa configuração isolada, os backups de banco de dados eram transparentemente redirecionados para o Amazon S3.
  • O armazenamento de dados durável fornecido pelo Amazon S3, que é projetado para durabilidade 11 noves. Ocasionalmente, a Amazon.com enfrentava falhas de hardware com infraestrutura de fita – fitas que quebravam, falhas nas unidades de fita e nos componentes robóticos. Algumas vezes isso acontece quando um DBA está tentando restaurar um banco de dados, e aumenta dramaticamente o mean time to recover (MTTR – tempo médio de recuperação). Com a durabilidade e disponibilidade do Amazon S3, esses problemas não são mais uma preocupação.
  • Liberar recursos humanos valiosos. Com a infraestrutura de fita, a Amazon.com tinha de procurar engenheiros com experiência em instalações de backup em fita muito grandes – um conjunto de habilidades específicas de fornecedor especializado que é difícil de encontrar. Eles também precisavam contratar técnicos de datacenter e dedicá-los à resolução de problemas e a diagnóstico de problemas de hardware – substituindo unidades, ordenando aleatoriamente fitas, enviando e rastreando fitas, e assim por diante. O Amazon S3 permitiu que eles liberassem esses especialistas das operações diárias de modo que pudessem trabalhar em tarefas de engenharia mais valiosas, críticas para o negócio.
  • Eliminação do transporte físico de fita para local externo. Qualquer empresa que tenha armazenado externamente os dados de backup do Oracle deve prestar atenção nos custos envolvidos no transporte, segurança e armazenamento de suas fitas externamente – esses custos podem ser reduzidos ou possivelmente eliminados pelo armazenamento dos dados no Amazon S3.

Como o maior varejista online do mundo, a Amazon.com inova continuamente ao fornecer experiência aprimorada ao cliente e oferecer produtos com os menores preços possíveis. Uma inovação desse tipo foi substituir a fita pelo armazenamento do Amazon S3 para backups de banco de dados. Essa inovação é uma que pode ser facilmente replicada por outras organizações que fazem backup de seus bancos de dados Oracle em fita.

Para saber mais sobre backup e armazenamento na AWS, visite: http://aws.amazon.com/backup-storage/.