Projetando uma estratégia de backup resiliente e econômica para o Amazon S3

Esta postagem foi escrita por Mojgan Toth, Gerente de Contas Técnico Sênior e Harish Mandhadi, Gerente de Contas Técnico Sênior. Adaptada para o português por Rogerio Xavier, Arquiteto de Soluções Sênior para Parceiros AWS.

Muitas organizações estão protegendo dados comerciais importantes contra desastres como incêndios, inundações ou eventos de ransomware. Estratégias adequadas de backup e recuperação de desastres podem ajudar a salvaguardar dados críticos e garantir a continuidade dos negócios em um cenário de desastre. Manter as operações normais em uma situação de recuperação de desastre pode economizar tempo e dinheiro.

Serviços da AWS como Amazon S3 e AWS Backup podem ajudar as organizações a proteger seus dados contra esses eventos de perda de dados. O Amazon S3 é um serviço fundamental na AWS que fornece armazenamento de objetos flexível, escalável e durável na nuvem. Além da resiliência integrada no Amazon S3 por meio do uso da infraestrutura global da AWS, o serviço também oferece vários recursos para ajudar a atender às suas necessidades de resiliência de dados e backup.

Neste post, descrevemos como projetar suas estratégias de backup e restauração para seus dados no Amazon S3 usando o AWS Backup para Amazon S3 e a Replicação entre Regiões (CRR) do Amazon S3. Guiaremos você por casos de uso e diferenças entre os dois métodos. Por fim, concluímos com as melhores práticas de desempenho e custo sobre este tópico.

Padrões de design de backup e replicação para Amazon S3

O AWS Backup para Amazon S3 permite que você copie seus backups do Amazon S3 entre Regiões da AWS e contas da AWS. Com backups do Amazon S3 em várias Regiões da AWS, você pode manter cópias separadas e protegidas de seus dados de backup para ajudar a atender aos requisitos de resiliência e conformidade para proteção de dados e recuperação de desastres. A Replicação entre Regiões (CRR) do Amazon S3 permite a replicação automática de objetos entre buckets do Amazon S3. Você pode replicar para uma classe de armazenamento diferente do Amazon S3 e/ou fazer failover para um bucket em outra Região da AWS. A Replicação na Mesma Região (SRR) do Amazon S3 é usada para copiar objetos entre buckets do Amazon S3 na mesma Região da AWS. Ela ajuda na agregação de logs de bucket único e na replicação em tempo real entre diferentes ambientes.

O ponto de partida lógico seria entender os modos de falha dos quais você está procurando se recuperar. Por exemplo, você está procurando proteger seus dados no Amazon S3 contra falhas em nível de região ou ataques de ransomware? Em seguida, entenda o que é considerado uma recuperação aceitável para o seu negócio. Você recupera todos os dados no Amazon S3 ou um subconjunto? Qual é o objetivo de tempo de recuperação (RTO) e o objetivo de ponto de recuperação (RPO) desejados para seus dados no Amazon S3?

Tanto o AWS Backup para Amazon S3 quanto o S3 CRR fornecem soluções de recuperação em caso de exclusões acidentais ou corrupção de dados. O S3 CRR copia objetos de forma assíncrona entre buckets do Amazon S3 em diferentes Regiões da AWS, enquanto o AWS Backup para Amazon S3 fornece uma experiência de restauração com um único clique para o Amazon S3 de maneira econômica. Os clientes também podem usar o Controle de Tempo de Replicação do S3 (S3 RTC) para replicar dados dentro da mesma Região da AWS ou entre regiões diferentes dentro de um período previsível. Ele replica a maioria dos objetos carregados no Amazon S3 em segundos e 99,99% dos objetos em 15 minutos. Consulte os pré-requisitos para replicação e replicação de objetos criptografados para obter mais detalhes.

A tabela a seguir fornece uma comparação rápida entre as duas abordagens:

Se seus usuários estiverem em duas localizações geográficas, você pode minimizar a latência no acesso aos objetos mantendo cópias de objetos em Regiões da AWS que estão geograficamente mais próximas de seus usuários.

	AWS Backup para Amazon S3	Amazon S3 CRR
Limites por bucket	Aproximadamente 30 bilhões de objetos por bucket.	Sem limites no número de objetos.
Rastreabilidade	Controles integrados que permitem rastrear operações de backup e restauração e gerar relatórios prontos para auditoria para demonstrar conformidade de backup ao auditor.	Para obter métricas detalhadas para a Replicação S3, incluindo métricas de contagem de regras de replicação, você pode usar o Amazon S3 Storage Lens. O S3 Storage Lens é um recurso de análise de armazenamento em nuvem que você pode usar para obter visibilidade em toda a organização sobre o uso e atividade de armazenamento de objetos. Além disso, existem quatro métricas do Amazon CloudWatch que oferecem boa visibilidade sobre o processo de replicação em andamento.
Recuperação pontual	Você pode restaurar seus objetos do Amazon S3 para um estado específico de um backup anterior.	Você pode combinar o Versionamento do Amazon S3 com o Amazon EventBridge para construir uma solução para um fluxo de eventos quase em tempo real do Amazon S3 para o processo de restauração pontual no nível do bucket.
Gerenciamento centralizado	Solução automatizada para configurar centralmente políticas de backup, ajudando você a simplificar o gerenciamento do ciclo de vida do backup e facilitando a garantia de que seus dados de aplicativos em serviços da AWS (como o Amazon S3) sejam centralmente copiados.	Este não é um recurso disponível hoje.
Retenção de metadados	Para backups periódicos, o AWS Backup faz o melhor esforço para rastrear todas as alterações nos metadados do seu objeto. No entanto, se você atualizar uma tag ou ACL várias vezes dentro de um minuto, o AWS Backup pode não capturar todos os estados intermediários.	Você pode usar a replicação para fazer cópias de seus objetos que mantêm todos os metadados, como os tempos de criação do objeto original e IDs de versão. Essa capacidade é importante se você precisar garantir que sua réplica seja idêntica ao objeto de origem. Além disso, se você habilitar a sincronização de modificação de réplica S3, ela permite que alterações de metadados feitas em objetos réplica sejam capturadas e replicadas de volta para o objeto de origem original. Isso torna a replicação bidirecional.
Latência	Projetado para proteger os dados do seu aplicativo, mas não para melhorar o desempenho do aplicativo.	Se seus usuários estiverem em duas localizações geográficas, você pode minimizar a latência no acesso aos objetos mantendo cópias de objetos em Regiões da AWS que estão geograficamente mais próximas de seus usuários.

Tabela 1: Comparação entre AWS Backup para Amazon S3 e Amazon S3 CRR

O AWS Backup para Amazon S3 tem três modos de operação:

Backups de Snapshot: Os Backups de Snapshot verificam o bucket inteiro e realizam solicitações GET em cada objeto, incorrendo assim em custos de Get do Amazon S3. Os backups são incrementais com retenção infinita, garantindo consistência pontual. No entanto, backups subsequentes podem levar mais tempo devido a verificações completas do bucket, especialmente para buckets grandes.
Backups contínuos: Após um backup inicial dos dados existentes, quaisquer alterações subsequentes nos dados são registradas continuamente e podem ser usadas para restaurações pontuais dentro de um período de retenção de até 35 dias. Por exemplo, se o backup inicial levar 10 dias para ser concluído, o sistema também rastreia as alterações feitas durante esse período inicial e as aplica ao backup.
Backups contínuos e de Snapshot (Combinados): Combine backups contínuos e de snapshot para períodos de retenção mais longos além de 35 dias. Os snapshots são tirados dos backups contínuos, eliminando solicitações extras, evitando assim nova verificação e reduzindo custos. A linhagem de dados é compartilhada se estiver usando o mesmo vault, evitando assim armazenamento duplicado entre snapshots e pontos de recuperação contínuos.

Backup e restauração

O planejamento eficaz antecipado de sua estratégia de backup e restauração é essencial. Certifique-se de revisar seus limites de serviço. Se você precisar aumentar os limites para acomodar seu uso do Amazon S3 durante a restauração, poderá abrir um caso de suporte com a AWS. Você determinou quais dados são críticos para o seu negócio? Restaurar esse conjunto de dados, identificado por prefixo, deve ser a primeira tarefa de restauração que você planeja. O tempo necessário para backup e restauração pode ser diferente, já que o Amazon S3 fragmenta ativamente os dados à medida que são restaurados.

Uma das características do AWS Backup para Amazon S3 é o vault que simplifica a proteção de dados sem sobrecarga de gerenciamento. O vault logicamente isolado do AWS Backup (atualmente em preview) armazena cópias de backup imutáveis que são bloqueadas por padrão e isoladas com criptografia usando chaves de propriedade da AWS. O Vault Lock pode ser ativado para segurança adicional para evitar que os backups sejam excluídos prematuramente. Observe que o backup inicial deve ser feito nas mesmas Regiões da AWS e na mesma conta do bucket de origem. Após o backup inicial, você pode agendar um trabalho de cópia para copiar dados para um bunker vault em outras Regiões da AWS para fins de isolamento e desastres em nível de Região da AWS. Você precisa de no mínimo duas cópias de seus dados para se proteger contra falhas em nível de Região da AWS. Os dados de backup devem ser restaurados primeiro antes que o cliente Amazon S3 possa realmente acessá-los. Portanto, o AWS Backup não tem a mesma capacidade que o CRR de apontar o cliente Amazon S3 para a cópia de réplica. Até o momento, o AWS Backup suporta uma opção de armazenamento quente. Embora seja possível ter várias versões e arquivos dos dados do Amazon S3, sem o recurso de recuperação pontual do AWS Backup para Amazon S3, o processo de reprodução do bucket para atingir o ponto no tempo desejado pode ser operacionalmente demorado.

O Amazon S3 CRR permite que você replique objetos S3 no nível do bucket, prefixo e objeto usando tags de objeto. Ele suporta versionamento de objetos e failover para um novo bucket na mesma Região da AWS ou em uma diferente. Você pode restaurar objetos do bucket de réplica usando a Replicação em Lote do Amazon S3. Se você precisar de um objetivo de tempo de recuperação (RTO) mais agressivo, a réplica pode ser configurada em modo ativo-standby. Isso permite que os clientes sejam redirecionados para a réplica em caso de falhas no bucket primário. Para objetivos de ponto de recuperação (RPO), você pode usar o Controle de Tempo de Replicação S3 (S3 RTC), que replica a maioria dos objetos em segundos após o upload e 99,99% em 15 minutos. Se você quiser alcançar a recuperação pontual, precisará construir um subconjunto da lista de objetos por meio do inventário do Amazon S3 para ser alimentado em uma operação em lote. Isso pode ser complexo e não é pronto para uso, em comparação com o AWS Backup para Amazon S3.

Considerações de custo e desempenho

Ao escolher seu plano de backup, você deve considerar cobranças adicionais, como armazenamento, custos de API, Amazon EventBridge, Versionamento do Amazon S3 e solicitações GET S3 em seus objetos Amazon S3. Para obter mais informações sobre os custos relacionados, consulte a Precificação do AWS Backup. Para o AWS Backup para Amazon S3, você deve rastrear e excluir pontos de recuperação expirados em seu vault de backup e backups parciais, que aumentam seus custos de armazenamento, mesmo que não sejam usados. Ao usar o modo Snapshot, você incorre em cobranças adicionais para eventos GET e EventBridge, bem como cobranças de criptografia se estiver usando CMK. Além disso, configure suas políticas de S3 Lifecycle para habilitar a “exclusão de marcadores de exclusão de objetos expirados”; isso ajuda a reduzir custos e melhorar o desempenho. Ao usar o Amazon S3 CRR, considere aproveitar o nível de armazenamento Amazon S3 apropriado na réplica.

Para acesso imediato e redundância, escolha Amazon S3 Standard, Amazon S3 Standard-IA ou Amazon S3 Intelligent-Tiering, sendo o Amazon S3 Standard ideal para recuperação de desastres ativo-ativo. Para backups otimizados em termos de custo sem acesso imediato, use o Amazon Simple Storage Service Glacier (Amazon S3 Glacier) e o S3 Glacier Deep Archive. Para economizar custos, o Amazon S3 One Zone-Infrequent Access (Amazon S3 One Zone-IA) é usado em uma Região da AWS secundária, oferecendo alta disponibilidade e durabilidade. Combinar o Amazon S3 One Zone-IA e o Amazon S3 CRR garante resiliência, conformidade e economia de custos. Os clientes devem estar cientes de cobranças adicionais que podem se aplicar aos serviços usados ao realizar replicação, como solicitações PUT de replicação na conta de destino, cobranças de recuperação S3, cobranças de transferência de dados entre regiões (DITR) (aplicáveis apenas para S3 CRR), cobranças Premium do S3 Replication Time Control (S3 RTC) e cobranças do CloudWatch se a coleta de métricas estiver habilitada para monitoramento de replicação. Consulte nossa página de preços e FAQs para obter detalhes completos sobre replicação de dados entre contas. Consulte Replicar Objetos Existentes com Replicação em Lote do Amazon S3, Amazon S3 Storage Lens e Analisando operações de API no Amazon S3 para obter mais informações sobre possíveis soluções de otimização de custos do Amazon S3.

Considerações de desempenho são aplicáveis tanto nas etapas de backup quanto de restauração. Para trabalhos de cópia do Amazon S3, no AWS Backup para Amazon S3, o desempenho depende de trabalhos simultâneos, tamanho do bucket, contagem de objetos e tipo de backup. Ajuste os períodos de retenção durante o primeiro trabalho de cópia até que seja concluído; e incrementos subsequentes são mais rápidos. Para melhor desempenho, substitua as políticas antigas do AWS Identity and Access Management (IAM) por políticas gerenciadas pela AWS e implemente regras combinadas de backup contínuo e snapshot. Essas medidas levam a um desempenho mais rápido, redução de varreduras completas de bucket e benefícios de custo com o AWS Backup para Amazon S3. O S3 CRR pode levar de alguns segundos a várias horas, dependendo do tamanho e quantidade de objetos. Mas se habilitarmos o S3 RTC, replicamos objetos 99,9% em 15 minutos. Filtros como Prefixo ou Tags otimizam a replicação, focando em subconjuntos específicos de objetos. O Amazon S3 suporta altas taxas de solicitação, como 3.500 solicitações PUT/COPY/POST/DELETE ou 5.500 solicitações GET/HEAD por segundo por prefixo. Com o Amazon S3 CRR, a paralelização com prefixos melhora o desempenho.

Limpeza

Não se esqueça de limpar seus recursos, como excluir recursos restaurados da AWS, plano de backup, pontos de recuperação ou vaults de backup para evitar cobranças futuras.

Conclusão

Neste post, revisamos como o AWS Backup para Amazon S3 e o Amazon S3 CRR podem ajudar a projetar estratégias de backup e restauração para seus dados no Amazon S3. A implementação desses serviços pode ajudar a proteger os dados de sua organização contra perda ou corrupção, atendendo às suas necessidades de desempenho e conformidade de maneira econômica. Se você estiver interessado em explorar mais, consulte este guia de desenvolvimento para AWS Backup para Amazon S3 e este guia de recursos para Replicação entre Regiões do Amazon S3.

Este blog foi traduzido para o Português, e o conteúdo original pode ser acessado aqui.

TAGS: Amazon S3, Amazon S3 Cross-Region Replication (CRR), Amazon S3 Replication, AWS Backup, AWS Cloud Storage

Autores

Mojgan Toth é uma Gerente de Contas Técnicos Sênior que ajuda proativamente clientes do setor público com orientação técnica estratégica e melhores práticas da nuvem AWS. Ela adora montar soluções em torno de arquitetura bem projetada, segurança e resiliência. Quanto à sua vida pessoal, ela adora cozinhar, pintar e passar tempo com sua família. Eles adoram atividades ao ar livre como andar de bicicleta e fazer caminhadas.

Harish Mandhadi. Como Gerente de Contas Técnicos Sênior e Líder de Suporte Empresarial na Amazon Web Services (AWS), Harish fornece orientação técnica estratégica para ajudar clientes de varejo e bens de consumo embalados (CPG). Ele se especializa em práticas de Resiliência e Engenharia, trabalhando de perto com clientes empresariais para construir soluções que possam resistir a falhas e continuar operando durante desastres. Harish gosta de passar tempo ao ar livre fazendo atividades como andar de motocicleta, crossfit, competir em corridas e passar tempo com sua família.

Tradutor

Rogerio Xavier é Arquiteto de Soluções Sênior para parceiros da AWS, atua ajudando parceiros na jornada de parceria com a AWS e a entregar a melhor solução aos clientes. Com mais de 15 anos de experiência em infraestrutura de TI, arquitetura e administração de sistemas. Nos ultimos 7 anos ele se dedicou em Redes, Storage (Block e Object), Sistemas Operacionais, Messaging, Migração de dados, Serverless, além de modernização de aplicações. Ele adora passar o tempo livre com a família e jogar video-game.

Revisor

Ricardo Tasso é Arquiteto de Soluções para parceiros na AWS, atua ajudando na jornada de parceria com a AWS e a entregar a melhor solução aos clientes. Trabalha com Administração de Sistemas e Soluções de TI há mais de 15 anos, com experiência em redes, storage, Sistemas Operacionais, filas e messaging, com foco nos últimos 7 anos em DevOps, Serverless, Containers, Infra como Código, CI/CD, IA para DevOps, além de arquitetura e modernização de aplicações.

O blog da AWS

Projetando uma estratégia de backup resiliente e econômica para o Amazon S3

Padrões de design de backup e replicação para Amazon S3

Backup e restauração

Considerações de custo e desempenho

Limpeza

Conclusão

Autores

Tradutor

Revisor

Aprenda

Recursos

Desenvolvedores

Ajuda