Geral

P: O que é o AWS DataSync?

R: O AWS DataSync é um serviço gerenciado de transferência de dados online que simplifica, automatiza e acelera a movimentação e a replicação de grandes quantidades de dados entre sistemas de armazenamento locais e serviços de armazenamento da AWS como Amazon S3 e Amazon EFS, por meio da Internet ou do AWS Direct Connect.

P: Por que devo usar o AWS DataSync?

R: O AWS DataSync permite movimentar, copiar e sincronizar grandes conjuntos de dados com milhões de arquivos, sem necessidade de criar soluções personalizadas com ferramentas de código aberto ou licenciar e gerenciar software comercial de aceleração de rede de alto custo. Você pode usar o DataSync para migração de dados ativos uma única vez, distribuição periódica para fluxos de trabalho de processamento de dados ou replicação contínua para continuidade de negócios.

P: Qual o problema resolvido pelo DataSync?

R: O DataSync reduz a complexidade e o custo da transferência de dados online, simplificando a transferência de conjuntos de dados entre sistemas de armazenamento locais e o Amazon S3 ou o Amazon Elastic File System (EFS). O DataSync estabelece uma conexão a sistemas de armazenamento e fontes de dados existentes usando um protocolo de armazenamento padrão (NFS) e usa um protocolo de rede especialmente criado e uma arquitetura de escalabilidade horizontal para acelerar a transferência de/para a AWS. O DataSync escala e processa automaticamente todas as tarefas relacionadas à movimentação de dados, monitorando o progresso de transferências, criptografia e validação de transferência de dados e notificando os clientes caso ocorra qualquer falha. Com o DataSync, você paga apenas pela quantidade de dados copiada, sem compromissos mínimos ou taxas adiantadas.

P: As transferências podem ser feitas de/para quais locais?

R: O DataSync pode copiar dados entre sistemas de armazenamento locais e os serviços Amazon S3 e Amazon EFS. O DataSync oferece suporte ao protocolo NFS para acessar armazenamento local.

Configuração

P: Como faço para começar a usar o DataSync?

R: Você pode transferir dados usando o DataSync com alguns cliques no Console de Gerenciamento da AWS ou por meio da Interface da Linha de Comando (ILC) da AWS. Para começar a usar, você implanta um agente do DataSync em seu ambiente de TI, configura os locais de origem e destino e inicia a cópia.

P: Como faço para implantar um agente do DataSync?

R: Você implanta um agente do DataSync fazendo download do OVA no Console AWS e implantando o OVA no hipervisor VMware ESXi local. O agente deve ser implantado no seu ambiente de TI para que possa acessar o servidor NFS local.

P: Quais são os requisitos de recursos do agente do DataSync?

R: Você pode encontrar os recursos mínimos necessários por agente aqui.

Uso

P: Como faço para usar o DataSync?

R: 1. Implante um agente: implante um agente do DataSync no local e associe-o à sua conta da AWS usando o console de gerenciamento ou a API. O agente será usado para acessar o NFS local para leitura/gravação de dados. Não há necessidade de implantar agentes no EC2 ou gerenciar recursos na nuvem.

2. Crie uma tarefa de transferência de dados: crie uma tarefa de transferência de dados especificando a localização da origem e do destino de dados, e quaisquer opções que deseja usar para configurar a transferência, como copiar os metadados do arquivo.

3. Inicie a transferência: inicie a tarefa e monitore o movimento de dados usando o console ou o Amazon CloudWatch.

P: Como posso iniciar uma tarefa do DataSync?

R: O DataSync copia dados quando você inicia uma tarefa usando o Console de Gerenciamento da AWS ou a ILC. Em cada execução, a tarefa verifica a existência de alterações na origem e copia todas as diferenças entre a origem e o destino. Você pode configurar quais características da origem serão usadas para determinar as alterações e se arquivos ou objetos no destino deverão ser excluídos se não forem encontrados na origem.  

P: Como o DataSync executa a validação da integridade dos dados?

R: O DataSync executa a verificação da integridade dos dados durante a transferência e ao final da transferência (comparação de soma de verificação entre arquivos de origem e destino e comparação de metadados de arquivos).

P: Como posso monitorar o status dos dados sendo transferidos pelo DataSync?

R: Você pode usar o Console de Gerenciamento da AWS ou a ILC para monitorar o status dos dados sendo transferidos. O Amazon CloudWatch Metrics pode ser usado para ver o número de arquivos e a quantidade de dados copiados. O Amazon CloudWatch Logs está disponível para fornecer informações detalhadas de erros. Além disso, o CloudWatch Events é acionado nas transições de estado das tarefas, o que permite automatizar fluxos de trabalho dependentes. Você pode encontrar informações adicionais sobre o progresso das transferências no Console de Gerenciamento da AWS ou na ILC.

P: Como o DataSync acessa o sistema de arquivos local?

R: O DataSync usa agentes implantados no seu ambiente de TI para acessar sistemas de arquivos locais por meio do protocolo NFS. Esses agentes estabelecem conexões à AWS usando a Internet ou o AWS Direct Connect e são gerenciados como segurança no Console de Gerenciamento da AWS ou na ILC. Não é preciso configurar uma VPN ou um túnel nem permitir conexões de entrada. Os agentes podem ser configurados para rotear através de um firewall usando portas de rede padrão.

P: Como o DataSync acessa um bucket do Amazon S3?

R: O DataSync acessa um bucket do Amazon S3 usando a função do IAM que você configurar.

P: Como o DataSync acessa o sistema de arquivos do Amazon EFS?

R: O DataSync acessa o sistema de arquivos do Amazon EFS por meio do protocolo NFS. Esse acesso é feito montando o sistema de arquivos de dentro da VPC usando interfaces de rede elástica (ENIs) gerenciadas pelo DataSync. O DataSync gerencia a criação, o uso e a exclusão dessas ENIs para você.

P: Na transferência de arquivos de/para o Amazon S3, como o DataSync mapeia arquivos e objetos?

R: Quando os arquivos são copiados para objetos, há uma relação de um para um entre um arquivo e um objeto. Os metadados do sistema de arquivos são armazenados nos metadados do usuário do S3. Os metadados são restaurados quando objetos que contêm metadados de sistemas de arquivos são copiados para arquivos.

P: Quais metadados são preservados pelo DataSync na transferência de dados?

R: O DataSync preserva metadados do POSIX como ID de usuário, ID de grupo e permissões para garantir que os arquivos possam ser restaurados para o local original sem perder esses metadados. Além disso, no armazenamento de metadados do POSIX de arquivos para objetos no S3, os metadados são interoperáveis com o File Gateway.

P: Posso usar o versionamento, o ciclo de vida, a replicação entre regiões e a notificação de eventos do S3 com o DataSync?

R: Sim. As políticas do bucket para versionamento, gerenciamento do ciclo de vida, replicação entre regiões e notificação de eventos do S3 são aplicadas diretamente aos objetos transferidos para o bucket por meio do DataSync.

Ao usar o versionamento, observe que as alterações nos metadados de objetos criarão uma nova versão do objeto.

É possível usar as políticas de ciclo de vida do S3 para alterar a camada de armazenamento de um objeto ou excluir versões de objetos ou objetos antigos.

P: Os dados são criptografados durante a transferência e o armazenamento?

R: Sim. Todos os dados transferidos entre a origem e o destino são criptografados por meio do Transport Layer Security (TLS, que substituiu o Secure Sockets Layer, SSL). Os dados nunca são persistidos no próprio DataSync. O serviço oferece suporte ao uso de criptografia padrão para buckets do S3 e criptografia de sistema de arquivos do Amazon EFS para dados ociosos.

P: O que acontece se uma tarefa do DataSync é interrompida?

R: Se uma tarefa é interrompida (por exemplo, se a conexão de rede cair ou o agente do DataSync é reiniciado), a próxima execução da tarefa transferirá os arquivos faltantes e os dados estarão completos e consistentes após a execução dessa tarefa. A cada vez que uma tarefa é iniciada, executa uma cópia incremental, transferindo apenas as alterações da origem para o destino.

P: Posso usar o DataSync com o AWS Direct Connect?

R: Sim. Você pode usar o DataSync com o seu link do Direct Connect para acessar endpoints públicos da Internet sem qualquer configuração especial.

Performance

P:  Qual a velocidade do DataSync para copiar um sistema de arquivos para a AWS?

R: A velocidade da cópia de um conjunto de dados específico pelo DataSync varia em função da quantidade de dados, da largura de banda de E/S obtida do armazenamento de origem e de destino, da largura de banda disponível e das condições da rede. Um único agente do DataSync consegue saturar um link de rede de 10 Gbps.

P:  Posso controlar a quantidade de largura de banda de rede usada pela tarefa do DataSync?

R: Sim. Você pode controlar a quantidade de largura de banda de rede usada pelo DataSync configurando o controle de utilização de largura de banda incorporado. Esse recurso ajuda a reduzir o impacto sobre os outros usuários ou aplicativos que dependem da mesma conexão de rede.

P:  O DataSync afetará a performance do sistema de arquivos de origem?

R: Dependendo da capacidade do armazenamento de arquivos local e da quantidade e do tamanho dos arquivos a serem transferidos, o DataSync pode afetar o tempo de resposta de outros clientes que acessam o mesmo datastore de origem, pois o agente lê/grava dados nesse sistema de armazenamento. A configuração de um limite de largura de banda para uma tarefa reduzirá esse impacto, limitando a E/S no sistema de armazenamento.

Conformidade

P:  Com quais programas de conformidade o DataSync é compatível?

R: A AWS tem o programa de conformidade ativo há mais tempo na nuvem e está comprometida a ajudar os clientes a percorrer seus requisitos. O DataSync foi avaliado e cumpre padrões de segurança globais e setoriais. O serviço está em conformidade com os padrões PCI DSS, ISO 9001, 27001, 27017 e 27018, além de ser qualificado pela HIPAA. Isso facilita a verificação da nossa segurança e o cumprimento de suas próprias obrigações. Para obter mais informações e recursos, acesse as nossas páginas de conformidade. Você também pode acessar a página Serviços da AWS no escopo pelo programa de conformidade para ver uma lista completa de serviços e certificações.

P:  O DataSync está em conformidade com o PCI?

R: Sim. O DataSync está em conformidade com o PCI-DSS, o que significa que você pode usar o serviço para transferir informações de pagamento. Você pode fazer download do pacote de conformidade do PCI no AWS Artifact para saber mais sobre como alcançar a conformidade com o PCI na AWS.

P:  O DataSync é qualificado pela HIPAA?

R: Sim. O DataSync é qualificado pela HIPAA, o que significa que, se você tiver um BAA da HIPAA com a AWS, poderá usar o DataSync para transferir Protected Health Information (PHI – Informações de saúde protegidas).

Quando escolher o AWS DataSync

P: Como escolher entre o AWS DataSync e a família do AWS Snowball Edge?

R: O AWS Snowball Edge é adequado para clientes que não precisam da disponibilidade imediata de seus dados na AWS, têm restrições de largura de banda ou transferem dados de ambientes remotos, desconectados ou severos. O DataSync é ideal para clientes que precisam de migrações online para conjuntos de dados ativos, transferências em tempo hábil para dados gerados continuamente ou replicação para continuidade de negócios.

P: Como escolher entre o AWS DataSync e o AWS Storage Gateway?

R: O AWS Storage Gateway oferece recursos de armazenamento na nuvem híbrida, conectando aplicativos locais a serviços de armazenamento da AWS com acesso de baixa latência, e é usado para backup, estratificação e acesso local a objetos armazenados no S3. O DataSync é usado para copiar rapidamente dados de/para os serviços de armazenamento da AWS. Você pode usar o DataSync para transferência rápida de dados existentes para o Amazon S3 e a configuração do File Gateway para o Storage Gateway a fim de acessar posteriormente esses dados com baixa latência no ambiente local.

 

P:  Como escolher entre o AWS DataSync e o S3 Transfer Acceleration?

R: Se os aplicativos já estiverem integrados à API do Amazon S3 e você quiser aumentar o throughput da transferência de arquivos grandes para o S3, poderá usar o S3 Transfer Acceleration. Se você quiser transferir dados de sistemas de armazenamento existentes (por exemplo, Network Attached Storage) ou de instrumentos que não podem ser alterados (por exemplo, sequenciadores de DNA, câmeras de vídeo), ou se quiser usar vários destinos, use o DataSync.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Saiba mais sobre a definição de preço

O AWS DataSync tem uma definição de preço simples, previsível e baseada no uso. Você paga apenas pela quantidade de dados copiada.  

Saiba mais 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastrar-se 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Comece a mover dados no console

Comece a criar com o AWS DataSync no Console AWS.

Faça login