Arquivamento

Os dados são armazenados no Amazon S3 Glacier em “arquivamentos”. Um arquivamento pode ser composto de qualquer tipo de dados, como fotos, vídeos ou documentos. É possível fazer o upload de um único arquivo como um arquivamento ou agregar vários arquivos em um arquivo TAR ou ZIP e fazer o upload como um único arquivamento.

Um único arquivamento pode ter até 40 terabytes. Você pode armazenar um número ilimitado de arquivamentos e uma quantidade ilimitada de dados no Amazon S3 Glacier. Cada arquivamento recebe um ID de arquivamento único, e seu conteúdo é imutável, ou seja, após a criação do arquivamento, não é possível alterá-lo.

Cofres

O Amazon S3 Glacier usa “cofres” como contêineres para armazenar arquivamentos. Você pode ver uma lista dos seus cofres no Console de Gerenciamento da AWS e usar os SDKs da AWS para executar diversas operações de cofre, como criar, excluir e bloquear cofres, listar metadados de cofres, recuperar inventários de cofres, aplicar tags a cofres para fins de filtragem e configurar notificações de cofre. Você também pode definir políticas de acesso em cada cofre para conceder ou negar atividades específicas aos usuários. Em uma única conta da AWS, é possível ter até 1.000 cofres.

Principais recursos

Recursos de recuperação de dados

O Amazon S3 Glacier disponibiliza três recursos de recuperação de arquivamentos para atender a requisitos variáveis de tempo e custos: recuperações expressas, padrão e em massa. Os arquivamentos solicitados usando as recuperações expressas geralmente são disponibilizados entre 1 e 5 minutos, permitindo que você acesse rapidamente seus dados quando forem feitas solicitações urgentes e ocasionais por um subconjunto de arquivamento. Com recuperações padrão, os arquivamentos geralmente são disponibilizados entre 3 e 5 horas. Como alternativa, você pode usar as recuperações em massa para acessar com economia um grande volume de dados, até mesmo petabytes, pagando apenas um quarto de centavo por GB.

Saiba mais sobre os recursos de recuperação de dados do Amazon S3 Glacier » 

Amazon S3 Glacier Select

O Amazon S3 Glacier Select permite que as consultas sejam executadas diretamente nos dados armazenados no Amazon S3 Glacier sem ter que recuperar o arquivamento todo. O Amazon S3 Glacier Select altera o valor do armazenamento de arquivamentos, permitindo que você processe e localize somente os bytes de que precisa fora do arquivamento para usar nas análises.

Agora, seu aplicativo de análises pode chamar a API do Amazon S3 Glacier Select para recuperar apenas os dados relevantes para a sua consulta no arquivamento do Amazon S3 Glacier. O Amazon S3 Glacier Select em breve será integrado com o Amazon Athena e o Amazon Redshift Spectrum; portanto, agora você pode considerar o arquivamento do S3 Glacier parte do seu data lake.

Antes do S3 Glacier Select, um arquivamento do Amazon S3 Glacier tinha que ser completamente restaurado antes de os dados poderem ser usados. Agora os clientes podem usar o S3 Glacier Select para baixar os custos e descobrir mais informações dos dados de arquivamento.

Integração do AWS Snowball e do Direct Connect

O AWS Snowball pode acelerar a transferência de grandes volumes de dados para dentro e para fora da AWS usando dispositivos portáteis de armazenamento como transporte. A AWS transfere os dados diretamente de/para dispositivos de armazenamento usando a rede interna de alta velocidade da Amazon, sem utilizar a Internet. Para conjuntos de dados significativos, o AWS Snowball é muitas vezes mais rápido do que a transferência pela Internet e mais econômico do que fazer a atualização para uma conectividade superior. Você pode usar o AWS Snowball para migrar dados para a nuvem, distribuir conteúdo aos clientes, enviar backups para a AWS e executar recuperação de desastres.

O AWS Direct Connect facilita a criação de uma conexão de rede dedicada de alta largura de banda entre o seu local e a AWS. Com o AWS Direct Connect, é possível transferir seus dados de negócios importantes diretamente de seu datacenter para a AWS, evitando o provedor de Internet e eliminando congestionamentos de rede. Além disso, o AWS Direct Connect facilita a escalabilidade da conexão para atender às suas necessidades de transferência de dados. O AWS Direct Connect fornece conexões de 1 Gbps e 10 Gbps, e você pode providenciar facilmente várias conexões se precisar de mais capacidade.

Vault Lock

O Amazon S3 Glacier Vault Lock permite que você implante facilmente e aplique controles de conformidade em cofres individuais do S3 Glacier por meio da política bloqueável. Você pode especificar controles como o “Write Once Read Many” (WORM) em uma política do Vault Lock e bloquear a política para que não sejam feitas edições futuras. Uma vez bloqueada, a política torna-se imutável, e o Amazon S3 Glacier aplicará os controles prescritos para ajudar você a alcançar seus objetivos de conformidade. Para saber mais, leia Vault Lock do Amazon S3 Glacier no Guia do desenvolvedor do Amazon S3 Glacier.

Controle de acesso

O Amazon S3 Glacier usa o AWS Identity and Access Management (IAM) para ajudar a controlar de forma segura o acesso à AWS e aos dados do Amazon S3 Glacier. Você pode criar usuários no IAM, atribuir credenciais de segurança individuais (ou seja, chaves de acesso, senhas e dispositivos de autenticação multifatorial) e políticas do IAM em cada cofre do Amazon S3 Glacier para conceder atividades permitidas aos usuários adequados.

Suporte à marcação

O Amazon S3 Glacier permite atribuir tags a cofres do S3 Glacier para facilitar o gerenciamento de recursos e custos. As tags são rótulos que você define e associa a seus cofres. O uso de tags adiciona recursos de filtragem a operações, como os relatórios de custos da AWS. Por exemplo, você pode usar tags para alocar os custos e o uso do S3 Glacier a diversos departamentos da sua organização ou por qualquer outro tipo de categoria. Para obter mais informações, consulte Marcação dos cofres do Amazon S3 Glacier.

Logs de auditoria

O Amazon S3 Glacier oferece suporte a logs de auditoria com o AWS CloudTrail, que registra chamadas de API do Amazon S3 Glacier em sua conta e fornece os arquivos de log para você. Esses arquivos de log proporcionam visibilidade das ações executadas nos ativos do Amazon S3 Glacier. Por exemplo, você pode determinar quais usuários acessaram um cofre no último mês ou identificar o autor, a data e a hora da exclusão de um determinado arquivamento. O uso de logs de auditoria pode ajudar a implementar objetivos de conformidade e governança para o sistema de arquivamento com base em nuvem. Para saber mais, leia Registro em log de auditoria com o Amazon S3 Glacier.

Políticas de acesso a cofres

As políticas de acesso a cofres permitem gerenciar facilmente o acesso a cofres individuais do S3 Glacier. Você pode definir uma política de acesso diretamente em um cofre, concedendo acesso a usuários e grupos de negócios internos da organização e a parceiros de negócios externos. Para saber mais, leia Gerenciamento das políticas de acesso a cofres no guia do desenvolvedor do Amazon S3 Glacier.

Inventário do cofre

O Amazon S3 Glacier mantém um inventário de todos os arquivamentos em cada um dos cofres, para fins de recuperação de desastres ou reconciliações ocasionais. O inventário do cofre é atualizado aproximadamente uma vez por dia. Você pode solicitar um inventário de cofre como um arquivo JSON ou CSV. O arquivo conterá detalhes sobre os arquivamentos, incluindo tamanho, data de criação e descrição do arquivamento se fornecida durante o upload. O inventário representará o estado do cofre no momento da atualização de inventário mais recente.

Políticas de recuperação de dados

As políticas de recuperação de dados do Amazon S3 Glacier permitem definir os seus próprios limites de recuperação de dados com apenas alguns cliques no Console AWS. Você pode limitar as recuperações a “Somente nível gratuito” ou, se desejar recuperar mais do que o nível gratuito, pode especificar uma “Taxa máxima de recuperação” para limitar a velocidade de recuperação e estabelecer um teto de custo de recuperação. Nos dois casos, o Amazon S3 Glacier não aceitará solicitações de recuperação que excedam os limites de recuperação definidos. Para saber mais, leia Configuração de políticas de recuperação dos dados no Guia do desenvolvedor do Amazon S3 Glacier.

Console de Gerenciamento da AWS

O Amazon S3 Glacier pode ser usado acessando o Console de Gerenciamento da AWS, uma interface web fácil de usar que oferece recursos para criar cofres, configurar permissões de acesso aos cofres e definir notificações do SNS para as recuperações de dados. O console também apresenta um resumo do uso do armazenamento em cada cofre, bem como o momento da última atualização do inventário do cofre.

Kits de desenvolvimento de software (SDKs) da AWS

O upload e a recuperação dos dados são executados usando os SDKs da AWS ou a API subjacente do Amazon S3 Glacier. O Amazon S3 Glacier é compatível com os SDKs da AWS para Java, .NET, PHP e Python (Boto). As bibliotecas do SDK encapsulam a API subjacente do Amazon S3 Glacier, simplificando as tarefas de programação. Esses SDKs oferecem bibliotecas com mapeamento a uma API REST subjacente e permitem criar solicitações e processar respostas com facilidade. Os SDKs da AWS para Java e .NET oferecem bibliotecas de APIs de alto e baixo nível.

API de baixo nível

As bibliotecas de encapsulamento de baixo nível são mapeadas estreitamente à API subjacente do Amazon S3 Glacier e oferecem a implementação mais completa das suas operações básicas.

API de alto nível

As APIs de alto nível simplificam ainda mais o desenvolvimento de aplicativos com uma abstração de nível mais alto para algumas operações. Por exemplo, ao fazer o upload de um arquivamento, a API de alto nível calcula automaticamente a soma de verificação.

Para obter informações sobre essas bibliotecas de SDK, consulte Como usar o AWS SDK for Java com o Amazon S3 Glacier e Como usar o AWS SDK para .NET com o Amazon S3 Glacier.

Gerenciamento integrado de ciclo de vida com o Amazon S3

O Amazon S3 Glacier trabalha em conjunto com as regras de ciclo de vida do Amazon S3 para ajudar a automatizar o arquivamento de dados do Amazon S3 e reduzir os custos gerais de armazenamento. É possível definir facilmente uma regra que armazena todas as versões anteriores de um objeto do Amazon S3 na categoria de armazenamento mais econômica do S3 Glacier e as exclui do armazenamento do S3 Glacier após 100 dias. Esse exemplo oferece uma janela de 100 dias para reverter qualquer mudança feita nos dados e reduzir automaticamente os custos de armazenamento. Para obter mais informações sobre a configuração do ciclo de vida e a transição de objetos para o Amazon S3 Glacier, consulte Gerenciamento do ciclo de vida de objetos no Guia do desenvolvedor do Amazon Simple Storage Service.  

Proteção de dados

Por padrão, os dados armazenados no Amazon S3 Glacier são protegidos. Somente os proprietários do cofre podem acessar os recursos que criam no Amazon S3 Glacier. O Amazon S3 Glacier criptografa os dados ociosos por padrão e é compatível com o trânsito seguro de dados usando SSL. Além disso, oferece suporte a mecanismos de controle de acesso com políticas do Identity and Access Management (IAM). Com os recursos de proteção de dados do Amazon S3 Glacier, você pode proteger seus dados contra falhas lógicas e físicas, perdas causadas por ações involuntárias de usuários, erros de aplicativo e falhas de infraestrutura. Para clientes que devem cumprir padrões normativos como PCI e HIPAA, os recursos de proteção de dados do Amazon S3 Glacier podem ser usados como parte de uma estratégia geral de obtenção de conformidade. Os vários recursos de segurança e confiabilidade de dados oferecidos pelo Amazon S3 Glacier são descritos detalhadamente a seguir.

Criptografia por padrão

O Amazon S3 Glacier criptografa automaticamente dados ociosos usando chaves simétricas Advanced Encryption Standard (AES) de 256 bits e oferece suporte à transferência segura de dados usando o Secure Sockets Layer (SSL).

Arquivamentos imutáveis

Os dados armazenados no Amazon S3 Glacier são imutáveis, ou seja, não é possível alterar o arquivamento após sua criação. Isso garante que dados como registros de conformidade e normatização não sejam alterados após o arquivamento.

Saiba mais sobre os arquivamentos do Amazon S3 Glacier »

Controle de acesso flexível com políticas do IAM

O Amazon S3 Glacier oferece suporte às políticas do Identity and Access Management (IAM), o que permite que organizações com vários funcionários criem e gerenciem vários usuários com uma única conta da AWS. Com as políticas do IAM, é possível criar políticas detalhadas para controlar os cofres do Amazon S3 Glacier. Você pode criar políticas do IAM para conceder ou revogar seletivamente determinadas permissões e ações em cada cofre do Amazon S3 Glacier.

Assinatura obrigatória de solicitações

O Amazon S3 Glacier exige que todas as solicitações sejam assinadas para oferecer proteção por autenticação. Para assinar uma solicitação, uma assinatura digital é calculada usando uma função criptográfica de hash que retorna um valor de hash. Esse valor deve ser incluído na solicitação como sua assinatura. Após receber a solicitação, o Amazon S3 Glacier recalcula a assinatura usando a mesma função de hash e entrada usadas para assinar a solicitação antes de seu processamento.

Saiba mais sobre a assinatura de solicitações do Amazon S3 Glacier »

Resiliência e confiabilidade de dados

O Amazon S3 Glacier oferece uma infraestrutura de armazenamento resiliente, projetada para armazenamento de arquivamento de dados de longo prazo. O Amazon S3 Glacier foi projetado para fornecer resiliência anual média de 99,999999999% para um arquivamento. O serviço armazena de forma redundante os dados em várias zonas de disponibilidade (AZs) da AWS e em vários dispositivos em cada AZ. Para aumentar a resiliência, o Amazon S3 Glacier armazena de forma sincronizada os dados em várias AZs antes de confirmar um upload bem-sucedido.

Para evitar a corrupção de pacotes de dados durante a transmissão, o Amazon S3 Glacier faz upload da soma de verificação de dados durante o upload. A soma de verificação recebida é comparada com a soma de verificação dos dados recebidos para detectar inversões de bits durante a transmissão. Da mesma forma, a autenticidade dos dados é validada com somas de verificação durante a recuperação dos dados. Ao contrário de sistemas tradicionais, que podem exigir verificações de dados e reparos manuais trabalhosos, o Amazon S3 Glacier executa verificações regulares e sistemáticas de integridade de dados e tem recursos de recuperação automática.

Saiba mais sobre as somas de verificação »

Gerenciamento de dados

Operações de arquivamento do Amazon S3 Glacier

O Amazon S3 Glacier oferece suporte às seguintes operações de arquivamento: upload, download e exclusão. Os arquivamentos são imutáveis e não podem ser alterados.

Upload de um arquivamento para o Amazon S3 Glacier

O upload de um arquivamento é uma operação síncrona. Você pode fazer o upload de um arquivamento em uma única operação ou fazer o upload de arquivamentos maiores em partes usando a API MultipartUpload para aumentar a taxa de transmissão e a tolerância a falhas. É possível fazer o upload de arquivamentos com tamanhos variando de 1 byte até 40 TB. Após o armazenamento resiliente do arquivamento, você receberá um ID de arquivamento único. Para obter mais informações, consulte Fazer upload de um arquivo no Amazon S3 Glacier e veja as recomendações sobre quando usar o MultipartUpload para aumentar o throughput.

Download de um arquivamento do Amazon S3 Glacier

O download de um arquivamento é uma operação assíncrona. Você deve primeiro iniciar uma tarefa de recuperação de um arquivamento específico. Após o recebimento de uma solicitação de tarefa, o Amazon S3 Glacier prepara o arquivamento para download. Após a conclusão da tarefa, você terá 24 horas para fazer download dos dados da área de preparação.

Exclusão de um arquivamento do Amazon S3 Glacier

Para excluir um arquivamento, você precisa usar a API REST ou os SDKs da AWS do Amazon S3 Glacier e especificar o ID do arquivamento. Além disso, é possível usar diversas ferramentas de terceiros para excluir os arquivamentos. Para obter mais informações, consulte Excluir um arquivo no Amazon S3 Glacier.

Uso pretendido e restrições

O uso deste serviço está sujeito ao Acordo do Cliente da Amazon Web Services.

Saiba mais sobre a definição de preço do Amazon S3 Glacier

Acesse a página de definição de preço