Geral

P: O que é o AWS DataSync?

R: O AWS DataSync é um serviço de transferência de dados online que simplifica, automatiza e acelera a cópia de grandes quantidades de dados entre os sistemas de armazenamento on-premises e os serviços de armazenamento da AWS e também entre serviços de armazenamento da AWS. O DataSync pode copiar dados entre o Network File System (NFS), servidores de arquivos do Server Message Block (SMB), armazenamento autogerenciado de objetos, AWS Snowcone, buckets do Amazon Simple Storage Service (Amazon S3) e sistemas de arquivos do Amazon Elastic File System (Amazon EFS) e do Amazon FSx for Windows File Server.

P: Por que devo usar o AWS DataSync?

R: O AWS DataSync permite copiar grandes conjuntos de dados com bilhões de arquivos, sem necessidade de criar soluções personalizadas com ferramentas de código aberto nem de licenciar e gerenciar software comercial caro para aceleração de rede. Você pode usar o DataSync para migrar dados ativos para a AWS, arquivar dados para liberar a capacidade de armazenamento on-premises, replicar dados para a AWS para fins de continuidade de negócios ou transferir dados para a nuvem para análises e processamento.

P: Qual é o problema que o AWS DataSync resolve?

R: O AWS DataSync reduz a complexidade e o custo da transferência de dados online, simplificando a transferência de conjuntos de dados entre sistemas de armazenamento on-premises e serviços do AWS Storage, e entre os serviços do AWS Storage. O DataSync conecta os sistemas de armazenamento existentes e as fontes de dados por meio de protocolos padrão (NFS, SMB) ou usando uma API do Amazon S3. Ele utiliza um protocolo de rede especificamente projetado e arquitetura expansível para acelerar a transferência entre os sistemas de armazenamento e os serviços da AWS. O DataSync escala e manuseia automaticamente todos os arquivos e objetos em movimento, programando transferências de dados, monitorando o progresso de transferências, criptografia e verificação de transferência de dados e notificando os clientes em caso de problemas. Com o DataSync, você paga apenas pela quantidade de dados copiada, sem compromissos mínimos ou taxas adiantadas.

P: As transferências podem ser feitas de/para quais locais?
R: O AWS DataSync pode transferir dados entre o Network File System (NFS), servidores de arquivos do Server Message Block (SMB), armazenamento de objetos autogerenciado, AWS Snowcone, buckets do Amazon Simple Storage Service (Amazon S3) e sistemas de arquivos do Amazon Elastic File System (Amazon EFS) e do Amazon FSx for Windows File Server.

P: Posso usar o AWS DataSync para migrar dados para a AWS?

R: Você pode usar o AWS DataSync para migrar dados locais para o Amazon S3, Amazon EFS e Amazon FSx for Windows File Server. Configure o DataSync para fazer uma cópia inicial de todo o conjunto de dados e programe transferências incrementais subsequentes dos dados que são alterados até a migração final do local para a AWS. O DataSync inclui criptografia e validação de integridade para ajudar a assegurar que os dados cheguem seguros, intactos e prontos para uso. Para minimizar o impacto nas cargas de trabalho que dependem da sua conexão de rede, você pode programar sua migração para uma execução fora do horário comercial ou limitar a largura de banda de rede que o DataSync usa, configurando a aceleração de largura de banda integrada. O DataSync preserva os metadados entre os sistemas de armazenamento que apresentam estruturas de metadados semelhantes, permitindo uma transição fácil de usuários finais e aplicativos para utilizarem seu serviço alvo do AWS Storage. Leia o post sobre armazenamento “Migrating storage with AWS DataSync” para obter dicas e conhecer as melhores práticas sobre migração.

P: Como posso usar o AWS DataSync para armazenar dados frios?

R: Você pode usar o AWS DataSync para transferir dados frios de sistemas de armazenamento on-premises para um armazenamento de longo prazo seguro e durável, como o Amazon S3 Glacier ou o Amazon S3 Glacier Deep Archive. Use a funcionalidade de filtros do DataSync para excluir arquivos e pastas temporários sendo copiados, fazer cópias em apenas um subconjunto de arquivos de um local de origem ou dividir um sistema de arquivos único entre vários destinos. Você pode selecionar o serviço de armazenamento mais econômico correspondente às suas necessidades: transfira dados para qualquer classe de armazenamento do S3, ou use o DataSync com o EFS Lifecycle Management para armazenar dados na classe de armazenamento Amazon EFS Infrequent Access (EFS IA). Use a funcionalidade interna de agendamento de tarefas para arquivar regularmente dados que devem ser mantidos para fins de conformidade ou auditoria, como registros, filmagens ou registros médicos eletrônicos. 

P: Como posso usar o AWS DataSync para replicar dados para a AWS a fim de manter a continuidade de negócios?

R: Com o AWS DataSync, você pode replicar arquivos periodicamente em quaisquer classes de armazenamento do Amazon S3 ou enviar os dados para o Amazon EFS ou o Amazon FSx for Windows File Server para ter um sistema de arquivos em espera. Use a funcionalidade de agendamento de tarefas interna para garantir que as alterações no conjunto de dados sejam copiadas regularmente para o armazenamento de destino. Leia este post sobre AWS Storage para saber mais sobre proteção de dados usando o AWS DataSync.

P: Como posso usar o AWS DataSync para transferências recorrentes entre on-premises e a AWS para fluxos de trabalho em andamento?

R: Você pode usar o AWS DataSync para transferências contínuas de sistemas on-premises para dentro ou fora da AWS para processamento. O DataSync pode ajudar a acelerar seus fluxos de trabalho essenciais de armazenamento na nuvem híbrida nos setores que precisam migrar arquivos ativos para a AWS rapidamente. Isso inclui machine learning em ciências biológicas, produção de vídeo em mídia e entretenimento, análise de big data em serviços financeiros e pesquisa sísmica em petróleo e gás. O DataSync fornece entregas oportunas para garantir processos dependentes não se atrasem. Você pode especificar filtros de exclusão, filtros de inclusão ou ambos para determinar quais arquivos, pastas ou objetos serão transferidos cada vez que você executar sua tarefa.

P: Posso usar o AWS DataSync para criar meu data lake?

R. Sim. Com o AWS DataSync, você pode criar facilmente seu data lake, automatizando a transferência de conjuntos de dados on-premises para o Amazon S3. O DataSync permite uma transferência simples e rápida de todo o seu conjunto de dados usando protocolos de armazenamento padrão (NFS ou SMB) ou a API do Amazon S3. Depois de transferir o conjunto de dados inicial, você pode agendar transferências subsequentes de novos dados de on-premises para a AWS. O DataSync inclui criptografia e validação de integridade para ajudar a assegurar que os dados cheguem seguros, intactos e prontos para uso. Para minimizar o impacto nas cargas de trabalho que dependem da sua conexão de rede, você pode programar tarefas de transferência para uma execução fora do horário comercial ou limitar a largura de banda de rede que o DataSync usa, configurando a aceleração de largura de banda integrada. Depois que seus dados chegarem ao Amazon S3, você poderá usar os serviços nativos da AWS para executar aplicativos de análise de big data, inteligência artificial (IA), machine learning (ML), computação de alta performance (HPC) e processamento de dados de mídia para obter informações de seus conjuntos de dados desestruturados. Leia a página da web de armazenamento do data lake da AWS para saber mais sobre a criação e utilização do seu data lake.

P: Como uso o AWS DataSync para transferir dados entre os serviços do AWS Storage?

R: Você pode usar o DataSync para transferir arquivos ou objetos entre o Amazon S3, o Amazon EFS ou o Amazon FSx for Windows File Server dentro da mesma conta da AWS. É possível transferir dados entre os serviços da AWS na mesma região da AWS, entre serviços em diferentes regiões comerciais da AWS, com exceção da China, ou entre regiões AWS GovCloud (EUA-Leste e EUA-Oeste). Isso não exige a implantação de um agente do DataSync, e pode ser configurado de ponta a ponta usando o console do AWS DataSync, a Command Line Interface (CLI – Interface de linhas de comando) da AWS ou o Software Development Kit (SDK – Kit de desenvolvimento de software) da AWS.

P: Posso usar o AWS DataSync para migrar para o Amazon WorkDocs?

R. Sim. O AWS DataSync acelera uma etapa necessária para o Amazon WorkDocs Migration Service automatizando o upload de arquivos para o bucket do Amazon S3 que é usado para a migração. Ele facilita e agiliza a migração de diretórios iniciais e compartilhamentos departamentais para o WorkDocs. Para saber mais sobre como usar o DataSync para migrações para o WorkDocs, leia o blog “Migrating network file shares to Amazon WorkDocs using AWS DataSync”.

Uso

P: O que preciso fazer para começar a usar o AWS DataSync?

R: Com alguns cliques, você pode transferir dados usando o AWS DataSync no Console de Gerenciamento da AWS ou por meio da Interface da Linha de Comando (ILC) da AWS. Para começar, siga as 3 etapas a seguir:

1. Para transferir dados entre sistemas de armazenamento on-premises e serviços do AWS Storage, implante um agente - implante um agente do DataSync e associe-o a sua conta da AWS por meio do Console de Gerenciamento ou da API. O agente será usado para acessar o servidor NFS, o compartilhamento de arquivos SMB ou o armazenamento de objetos autogerenciado para leitura e gravação de dados. A implantação de um agente não é necessária para transferir dados entre serviços do AWS Storage dentro da mesma conta da AWS.

2. Crie uma tarefa de transferência de dados - crie uma tarefa de transferência de dados especificando a localização da origem e do destino de dados, e quaisquer opções que deseja usar para configurar a transferência, como copiar os metadados do arquivo.

3. Iniciar a transferência - inicie a tarefa e monitore a movimentação de dados usando o console ou o Amazon CloudWatch.

P: Como posso implantar um agente do AWS DataSync?

R: Você deve implantar o agente do AWS DataSync no hipervisor no local ou no Amazon EC2. Para copiar dados de/em um servidor de arquivos on-premises, faça download da imagem de máquina virtual do agente no Console AWS e implante-o no hipervisor VMware ESXi, Linux Kernel-based Virtual Machine (KVM) ou Microsoft Hyper-V on-premises. Quando um agente do DataSync é utilizado, é necessário implantar o agente para que ele possa acessar o servidor de arquivos usando o protocolo NFS ou SMB, ou a API Amazon S3. Para configurar transferências entre seu S3 nos buckets do AWS Outposts ou do S3 em regiões da AWS, implante o agente em seu posto avançado. Para configurar transferências entre o dispositivo do AWS Snowcone e o armazenamento da AWS, use a AMI do agente DataSync que vem pré-instalada no dispositivo.

A implantação de um agente não é necessária para transferir dados entre serviços do AWS Storage dentro da mesma conta da AWS. Para copiar dados para ou de um servidor de arquivos autogerenciado na nuvem, ou entre serviços do AWS Storage em diferentes contas da AWS, execute uma instância do Amazon EC2 usando uma AMI do agente do DataSync.

P: Quais são os requisitos de recursos do agente do AWS DataSync?

R: Os recursos mínimos necessários para executar o agente estão relacionados aqui.

P: Como inicio uma tarefa de transferência de dados do AWS DataSync?

R: O AWS DataSync copia dados quando você inicia uma tarefa usando o Console de Gerenciamento da AWS ou a Interface de linhas de comando (CLI) da AWS. Em cada execução, a tarefa verifica a existência de alterações na origem e no destino e copia todas as diferenças de dados e metadados entre a origem e o destino. Você pode configurar quais características da origem serão usadas para determinar as alterações, definir filtros para incluir e excluir pastas ou arquivos específicos e controlar se é necessário substituir os arquivos ou objetos no destino quando alterados ou excluí-los se não encontrados na origem.

P: Como o AWS DataSync pode garantir que meus dados estão sendo copiados corretamente? 

R: Enquanto transfere e armazena os dados, o AWS DataSync executa verificações de integridade que determinam se os dados gravados no destino correspondem aos que estão sendo lidos na origem. Além disso, uma verificação de verificação opcional pode ser executada para comparar a origem e o destino no final da transferência. O DataSync irá calcular e comparar as somas de verificação de arquivo completo dos dados armazenados na origem e no destino. É possível verificar todo o conjunto de dados ou apenas os arquivos ou objetos que o DataSync transferiu.

P: Como posso monitorar o status dos dados que estão sendo transferidos pelo AWS DataSync?

R: Você pode usar o Console de Gerenciamento da AWS ou a ILC para monitorar o status desses dados. O Amazon CloudWatch Metrics pode ser usado para ver o número de arquivos e a quantidade de dados copiados. Você também pode ativar o registro em log de arquivos individuais para o CloudWatch Logs, para identificar o que foi transferido em determinado momento, bem como os resultados da verificação de integridade de conteúdo realizada pelo DataSync. Isso simplifica o monitoramento, a elaboração de relatórios e a solução de problemas e permite fornecer atualizações pontualmente às partes interessadas. Você pode encontrar informações adicionais, como o progresso das transferências, no Console de Gerenciamento da AWS ou na ILC.

P: Posso filtrar os arquivos e pastas que o AWS DataSync transfere?

R: Sim. Você pode especificar um filtro de exclusão, um filtro de inclusão ou os dois tipos de filtros para limitar os arquivos, as pastas ou os objetos transferidos em cada execução de uma tarefa. Na criação da tarefa, você configura os caminhos de arquivos ou as chaves de objetos que devem sempre ser excluídos da cópia. Quando você inicia uma tarefa, configura os caminhos de arquivos ou as chaves de objetos que devem ser incluídos naquela execução da tarefa. Se nenhum filtro for configurado, a cada vez que uma tarefa for executada, transferirá todas as alterações da origem para o destino. Leia esse blog de armazenamento da AWS para saber mais sobre como usar filtros comuns com o DataSync.

P: Posso configurar o AWS DataSync para fazer uma transferência para um cronograma?

R: Sim. Você pode programar suas tarefas usando o AWS DataSync Console ou a AWS Command Line Interface (CLI), sem precisar gravar ou executar scripts para gerenciar as transferências repetidas. O agendamento de tarefas as executa automaticamente dentro do cronograma que você configura, com as opções horárias, diárias ou semanais fornecidas diretamente no Console. Isso permite que você garanta que as mudanças feitas no seu conjunto de dados sejam automaticamente detectadas e copiadas em seu armazenamento destino.

P: O AWS DataSync preserva a estrutura de descobertas ao copiar arquivos?

R: Sim. Na transferência de arquivos, o DataSync cria uma estrutura de diretório no destino que é similar à estrutura do local de origem.

P: O que acontece se uma tarefa do AWS DataSync for interrompida?

R: Se uma tarefa for interrompida (por exemplo, se a conexão de rede cair ou se o agente do AWS DataSync for reiniciado), a execução seguinte dessa tarefa transferirá os arquivos que faltam. Os dados estarão completos e consistentes após essa execução. Cada vez que uma tarefa é iniciada, ele executa uma cópia incremental, transferindo para o destino apenas o que difere na origem.

P: Posso usar o AWS DataSync com o AWS Direct Connect?

R: Sim. Você pode usar o AWS DataSync com seu link do Direct Connect para acessar endpoints de serviços públicos ou VPC endpoints privados. A usar os VPC endpoints, os dados transferidos entre o agente do DataSync e os produtos da AWS não passam pela Internet pública nem usam endereços IP públicos, o que aumenta a segurança dos dados durante a cópia pela rede.

P: O AWS DataSync é compatível com VPC endpoints ou com o AWS PrivateLink?

R. Sim. Você pode usar VPC endpoints para evitar que os dados transferidos pelo agente do AWS DataSync, seja implantado no local ou na nuvem, passem pela Internet pública ou precisem de endereços IP públicos. O uso de VPC endpoints aumenta a segurança de seus dados porque mantêm o tráfego de rede restrito à Amazon Virtual Private Cloud (Amazon VPC). Os VPC endpoints do DataSync são desenvolvidos pelo AWS PrivateLink, uma tecnologia escalável altamente disponível que permite a conexão privada entre uma VPC e os serviços da AWS compatíveis.

P: Como configurar o AWS DataSync para usar VPC endpoints?

R: Para usar VPC endpoints com o AWS DataSync, basta criar um VPC endpoint de interface do AWS PrivateLink para o serviço do DataSync na VPC de sua escolha. Depois, selecione a interface de rede elástica (ENI) desse endpoint ao criar seu agente do DataSync. O agente se conectará a essa ENI na ativação e, a partir desse momento, todos os dados transferidos pelo agente permanecerão dentro da VPC configurada. Para configurar VPC endpoints, você pode usar o console do AWS DataSync, a interface da linha de comando da AWS (ILC) ou o AWS SDK. Para saber mais, consulte Using AWS DataSync in a Virtual Private Cloud.

Transferindo de e para o Amazon S3

P: Posso copiar meus dados para o Amazon S3 Glacier, Amazon S3 Glacier Deep Archive ou outras classes de armazenamento do S3?

R: Sim. Ao configurar um bucket do S3 para uso com o AWS DataSync, é possível selecionar a classe de armazenamento do S3 que o DataSync usa para armazenar objetos. O DataSync é compatível com o armazenamento de dados diretamente no S3 Standard, S3 Intelligent-Tiering, S3 Standard-Infrequent Access (S3 Standard – IA), S3 One Zone-Infrequent Access (S3 One Zone – IA), Amazon S3 Glacier (S3 Glacier) e Amazon S3 Glacier Deep Archive (S3 Glacier Deep Archive). Mais informações sobre as classes de armazenamento do Amazon S3 podem ser encontradas no Guia do desenvolvedor do Amazon Simple Storage Service.

Objetos menores que a capacidade de carga mínima por objeto serão armazenados no S3 Standard. Por exemplo, os objetos de pasta, com tamanho de zero bytes contendo apenas metadados, serão armazenados no S3 Standard. Leia sobre as considerações ao trabalhar com classes de armazenamento do Amazon S3 em nossa documentação. Para mais informações sobre os recursos de cobrança mínima, consulte a Definição de preço do Amazon S3.

P: Posso copiar dados das classes de armazenamento S3 Standard-IA e S3 One Zone-IA?

R: Sim. Ao usar o S3 como local de origem para uma tarefa do AWS DataSync, o serviço irá recuperar todos os objetos do bucket que precisam ser copiados para o destino. Recuperar objetos das classes de armazenamento S3 Standard-IA e S3 One Zone-IA incorrerá em uma taxa de recuperação baseada no tamanho dos objetos. Leia sobre as considerações ao trabalhar com classes de armazenamento do Amazon S3 em nossa documentação.

P: Posso copiar dados do S3 Glacier e do Amazon S3 Glacier Deep Archive?

R: Ao usar o S3 como local de origem para uma tarefa do AWS DataSync, o serviço tentará recuperar todos os objetos do bucket que precisam ser copiados para o destino. Recuperar objetos que são arquivados no S3 Glacier ou em classes de armazenamento do S3 Glacier Deep Archive resulta em um erro. Quaisquer erros na recuperação de objetos arquivados será registrada pelo DataSync e resultarão no status de falha na conclusão da tarefa. Leia sobre as considerações ao trabalhar com classes de armazenamento do Amazon S3 em nossa documentação.

P: Como o AWS DataSync acessa o meu bucket do Amazon S3?

R: O AWS Datasync assume uma função do IAM que você fornecer. A política que você anexar à função determina quais ações essa função pode executar. O DataSync pode gerar automaticamente essa função em seu nome ou você pode Configurar uma função manualmente.

P: Como o AWS DataSync converte pastas e arquivos em objetos do Amazon S3 e vice-versa?

R: Quando se copiam pastas e arquivos no Amazon S3, estabelece-se uma relação de um para um entre uma pasta ou arquivo e um objeto. Os carimbos de data/hora e as permissões POSIX das pastas e arquivos, inclusive os ID de usuário e de grupo, assim como as permissões, são armazenados nos metadados de usuário do S3. Para compartilhamentos NFS, os metadados de arquivos armazenados nos metadados de usuário do S3 podem interoperar totalmente com o File Gateway, permitindo acesso on-premises baseado em arquivos aos dados armazenados no Amazon S3 pelo AWS DataSync.

Quando o DataSync copia objetos que contêm esses metadados de usuário num servidor NFS, os metadados do arquivo são restaurados. Links simbólicos e hard links também são recuperados em operações de cópia de retorno do NFS para o S3.

Quando ele copia dados de um compartilhamento de arquivos SMB, permissões POSIX padrão são armazenadas nos metadados de usuário do S3. Quando ele os copia num compartilhamento de arquivos SMB, a propriedade se define com base no usuário configurado no DataSync para acessar aquele compartilhamento para a atribuição das permissões padrão.

Saiba mais sobre como o DataSync armazena arquivos e metadados em nossa documentação.

P: Quais metadados de objetos são preservadas ao transferir objetos entre o armazenamento autogerenciado de objetos e o Amazon S3?

R: Ao transferir objetos entre um armazenamento de objetos autogerenciado e o Amazon S3, o DataSync copia os objetos juntamente com seus metadados e tags.

P: Quais metadados de objetos são preservadas ao transferir objetos entre buckets do Amazon S3?

R: Ao transferir objetos entre buckets do Amazon S3, o DataSync copia os objetos juntamente com seus metadados e tags. O DataSync não copia outras informações dos objetos, como ACLs ou versões anteriores.

P: Quais custos de solicitação e armazenamento do Amazon S3 se aplicam ao usar as classes de armazenamento do S3 com o AWS DataSync?

R: Algumas classes de armazenamento do S3 têm comportamentos que podem afetar seu custo, como recuperação de dados, recursos de armazenamento mínimo e durações mínimas de armazenamento. O DataSync automatiza o gerenciamento de dados para processar esses fatores e fornece as configurações para minimizar a recuperação de dados.

Para evitar cobranças de capacidade mínimas por objeto, o AWS DataSync automaticamente armazena objetos pequenos no S3 Standard. Para minimizar as taxas de recuperação de dados, você pode configurar o DataSync para verificar apenas os arquivos que foram transferidos por uma determinada tarefa. Para evitar cobranças mínimas pela duração do armazenamento, o DataSync possui controles para substituir e excluir objetos. Leia sobre as considerações ao trabalhar com classes de armazenamento do Amazon S3 em nossa documentação.

P: Posso copiar dados de objeto de/para buckets do Amazon S3 no AWS Outposts?

R. Sim. Você pode copiar objetos entre o Amazon S3 no AWS Outposts e os buckets do Amazon S3 nas regiões da AWS. O AWS DataSync copia objetos junto com metadados de objeto e tags de objeto. Para que o DataSync acesse seu Amazon S3 nos buckets do Outposts, implante um agente de EC2 do DataSync no seu Outpost.

Ao usar o DataSync com o Amazon S3 no Outposts, você só pode transferir dados de/para buckets do Amazon S3 nas regiões da AWS. Você pode aprender mais sobre as origens e os destinos com suporte para tarefas do DataSync em nossa documentação.

Transferindo de/para o Amazon EFS

P: Como o AWS DataSync acessa um sistema de arquivos do Amazon EFS?

R: O AWS DataSync acessa sistemas de arquivos do Amazon EFS usando o protocolo NFS. O serviço do DataSync monta o seu sistema de arquivos de dentro da VPC em interfaces de rede elástica (ENIs) gerenciadas pelo serviço DataSync. O DataSync gerencia a criação, o uso e a exclusão dessas ENIs para você.

P: Posso usar o AWS DataSync com classes de armazenamento do Amazon EFS?

R: Sim. Você pode usar o AWS DataSync para copiar arquivos para o Amazon EFS e configurar o EFS Lifecycle Management para migrar arquivos que ainda não foram acessados por um período determinado de tempo para classes de armazenamento do Infrequent Access (IA).

P: Posso usar o AWS DataSync para replicar meu sistema de arquivos do Amazon EFS para uma região da AWS diferente?

R. Sim. Você pode usar o AWS DataSync para programar a replicação periódica de seu sistema de arquivos da Amazon EFS para um segundo sistema de arquivos da Amazon EFS dentro da mesma conta da AWS. Essa funcionalidade está disponível para implantações na mesma região e entre regiões e não exige o uso de um agente do DataSync.

P: Quais metadados são preservados ao copiar dados entre um compartilhamento do NFS e o Amazon EFS, ou entre dois sistemas de arquivos do Amazon EFS?

R: O AWS DataSync copia carimbos de data/hora e as permissões POSIX das pastas e arquivos, inclusive os IDs de usuário e de grupo, assim como as permissões. Você pode obter mais informações e ver a lista completa de metadados copiados em nossa documentação.

Transferência de/para o Amazon FSx for Windows File Server

P: Como o AWS DataSync acessa o sistema de arquivos do Amazon FSx?

R: O AWS DataSync acessa o sistema de arquivos do Amazon FSx usando o protocolo SMB, autenticando com o nome de usuário e a senha configurados no Console AWS ou na CLI. O serviço DataSync monta o seu sistema de arquivos de dentro da VPC em interfaces de rede elástica (ENIs) gerenciadas pelo serviço DataSync. O DataSync gerencia a criação, o uso e a exclusão dessas ENIs para você.

P: Quais metadados do Windows são transferidos ao copiar entre um compartilhamento do SMB para o sistema de arquivos do Amazon FSx for Windows File Server ou entre dois sistemas de arquivos do Amazon FSx?

P: O AWS DataSync copia metadados do Windows, incluindo carimbos de data/hora de arquivo, proprietário de arquivo, atributos de arquivo padrão e listas de acesso discricionárias (DACLs) do NTFS. Você pode obter mais informações e ver a lista completa de metadados copiados em nossa documentação.

P: Posso usar o AWS DataSync para replicar meu sistema de arquivos do Amazon FSx for Windows File Server para uma região diferente da AWS?

R. Sim. Você pode usar o AWS DataSync para programar a replicação periódica do sistema de arquivos do Amazon FSx for Windows File Server para um segundo sistema de arquivos dentro da mesma conta da AWS. Essa funcionalidade está disponível para implantações na mesma região e entre regiões e não exige o uso de um agente do DataSync.

Transferência de/para o AWS Snowcone

P: Como transfiro dados entre o AWS Snowcone e os serviços de armazenamento da AWS?

R: O agente do DataSync está pré-instalado no seu dispositivo do Snowcone como uma AMI. Para transferir dados online para a AWS, conecte o dispositivo do AWS Snowcone à rede externa e use o AWS OpsHub ou a CLI para iniciar a AMI do agente do DataSync. Ative o agente usando o Console de Gerenciamento da AWS ou CLI e configure sua tarefa de transferência de dados online entre o armazenamento de NFS do AWS Snowcone e o Amazon S3, o Amazon EFS ou o Amazon FSx for Windows File Server.

Performance

P: Qual a velocidade do AWS DataSync para copiar um sistema de arquivos na AWS?

R: A velocidade da cópia de um conjunto de dados específico pelo AWS DataSync varia em função da quantidade de dados, da largura de banda de E/S nos armazenamentos de origem e de destino, da largura de banda disponível e das condições da rede. Para a transferência de dados entre serviços on-premises e os do AWS Storage, uma única tarefa do DataSync é capaz de utilizar totalmente um link de rede de 10 Gbps.

P: Posso controlar o volume da largura de banda da rede usada por uma tarefa do AWS DataSync?

R: Sim. Você pode controlar o volume da largura de banda de rede usada pelo AWS DataSync configurando o controle de utilização de largura de banda integrado. Você pode aumentar ou reduzir esse limite enquanto a tarefa de transferência de dados está em execução. Esse recurso permite que você reduza o impacto sobre outros usuários ou aplicações que dependem da mesma conexão de rede.

P: Como posso monitorar a performance do AWS DataSync?

R: O AWS DataSync gera métricas do Amazon CloudWatch para fornecer visibilidade granular aos processos de transferência. Usando essas métricas, você pode ver o número de arquivos e a quantidade de dados que foram copiados, bem como o progresso da descoberta e verificação de arquivos. Você pode ver os Gráficos do CloudWatch com tais métricas diretamente no Console do DataSync.

P: O AWS DataSync afeta a performance do sistema de arquivos de origem?

R: Dependendo da capacidade do armazenamento local de arquivos e da quantidade e tamanho dos arquivos a serem transferidos, o AWS DataSync pode afetar o tempo de resposta de outros clientes que acessam o mesmo datastore de origem, pois o agente lê/grava dados nesse sistema de armazenamento. A configuração de um limite de largura de banda para uma tarefa reduzirá esse impacto, limitando a E/S no sistema de armazenamento.

Segurança e conformidade

P: Os dados são criptografados durante a transferência e o armazenamento?

R: Sim. Todos os dados transferidos entre a origem e o destino são criptografados por meio do Transport Layer Security (TLS), que substituiu o Secure Sockets Layer (SSL). Os dados nunca são persistidos no próprio AWS DataSync. O serviço oferece suporte usando criptografia padrão para buckets do S3criptografia de dados ociosos do sistema de arquivos do Amazon EFS e criptografia de dados ociosos e em trânsito do Amazon FSx for Windows File Server.

P: Como o AWS DataSync acessa meu servidor NFS e meu compartilhamento de arquivos SMB?

R: Para acessar os seus arquivos por meio do protocolo NFS ou SMB, o AWS DataSync usa um agente implantado no seu ambiente de TI ou no Amazon EC2. Esses agentes se conectam aos endpoints de serviço do DataSync na AWS e são gerenciados com segurança no Console de gerenciamento da AWS ou na CLI.

P: Como o AWS DataSync acessa meu armazenamento de objetos autogerenciado?

R: O AWS DataSync utiliza um agente, que você implanta no seu ambiente de TI ou no Amazon EC2, para acessar seus objetos utilizando a API do Amazon S3. Esses agentes se conectam aos endpoints de serviço do DataSync na AWS e são gerenciados com segurança no Console de gerenciamento da AWS ou na CLI.

P: O AWS DataSync exige a configuração de uma VPN para se conectar com meu armazenamento de destino?

R: Não. Ao copiar dados de ou para os seus locais, não é necessário configurar uma VPN/túnel ou permitir conexões de chegada. O seu agente do AWS DataSync pode ser configurado para guiar em um firewall usando portas de rede padrão. Você também pode implantar o DataSync em sua Amazon Virtual Private Cloud (Amazon VPC) usando VPC endpoints. A usar os VPC endpoints, os dados transferidos entre o agente do DataSync e os produtos da AWS não precisam passar pela Internet pública nem usar endereços IP públicos.

P: Como meus agentes do AWS DataSync se conectam à AWS com segurança?

R: Seus agentes do AWS DataSync se conectam aos endpoints de serviço da região da AWS que você selecionar. Você pode fazer com que ele se conecte a endpoints voltados para a internet pública, endpoints validados pelos Federal Information Processing Standards (FIPS – Padrões de processamento de informação federal) ou endpoints em uma das suas VPCs. Ativar seu agente o torna associado de forma segura à sua conta AWS. Para saber mais, consulte Escolher um endpoint de serviço e Ative seu agente.

P: Como meu agente do AWS DataSync recebe patches e atualizações?

R: As atualizações na VM do agente, incluindo o sistema operacional subjacente e os pacotes de software do AWS DataSync, são aplicados automaticamente aplicados pela AWS quando o agente é ativado. As atualizações são aplicadas sem causar interrupções quando o agente está ocioso e sem executar uma tarefa de transferência de dados.

P: Com quais programas de conformidade o AWS DataSync é compatível?

R: A AWS possui o programa de conformidade mais antigo na nuvem. E se compromete a ajudar clientes explorar seus requisitos. O AWS DataSync foi avaliado e cumpre padrões de segurança globais e setoriais. O DataSync está em conformidade com PCI DSS, ISO 9001, 27001, 27017 e 27018; SOC 1, 2, e 3; além de ser qualificado pela HIPAA. O DataSync também está autorizado nas regiões da AWS Leste/Oeste dos EUA, com nível moderado do FedRAMP, e nas regiões da AWS GovCloud (EUA), com nível alto do FedRamp. Isso facilita a verificação da nossa segurança e o cumprimento de suas próprias obrigações. Para obter mais informações e recursos, acesse as nossas páginas de conformidade. Você também pode acessar a página Serviços em foco do programa de conformidade para ver a lista completa de serviços e certificações.

P: O AWS DataSync está em conformidade com o PCI?

R. Sim. O AWS DataSync obedece ao PCI-DSS, o que significa que você pode usar o serviço para transferir informações de pagamento. Faça download do pacote de conformidade do PCI no AWS Artifact para informar-se sobre como alcançar a conformidade com o PCI na AWS.

P: O AWS DataSync é qualificado pela HIPAA?

R: Sim. O AWS DataSync é qualificado pela HIPAA, o que significa que, se você tiver um BAA da HIPAA com a AWS, poderá usar o DataSync para transferir Protected Health Information (PHI – Informações de saúde protegidas).

P:  O AWS DataSync tem autorização provisória de nível moderado do JAB no FedRAMP nas regiões da AWS Leste/Oeste dos EUA?

R. Sim. O AWS DataSync recebeu uma autorização provisória para operar (P-ATO – Provisional Authority to Operate) do Joint Authorization Board (JAB – Conselho de Autorização) sujeita à linha de base moderada do programa Federal Risk and Authorization Management Program (FedRAMP – Programa Federal de Gerenciamento de Risco e Autorização) nas regiões Leste/Oeste dos EUA. Se você é um cliente comercial ou federal, pode usar o AWS DataSync no limite de autorização da região Leste/Oeste da AWS com dados que tenham até o nível de impacto moderado.

P:  O AWS DataSync tem autorização provisória do JAB no FedRAMP nas regiões da AWS GovCloud (EUA)?

R. Sim. O AWS DataSync recebeu uma autorização provisória para operar (P-ATO) do Joint Authorization Board (JAB) sujeita à linha de base alta do programa federal de gerenciamento de risco e autorização (FedRAMP) na região GovCloud dos EUA. Se você é um cliente comercial ou federal, pode usar o AWS DataSync no limite de autorização da região da AWS GovCloud (EUA) com dados que tenham até o nível de alto impacto.

Quando escolher o AWS DataSync

P: Qual é a diferença entre usar o AWS DataSync e ferramentas da linha de comando, como rsync ou a interface da linha de comando do Amazon S3?

R: O AWS DataSync automatiza e acelera completamente a transferência de grandes conjuntos de dados ativos para a AWS. É integrado de forma nativa ao Amazon S3, Amazon EFS, Amazon FSx for Windows File Server, Amazon CloudWatch e AWS CloudTrail, o que garante acesso seguro e contínuo aos seus serviços de armazenamento, além de processos de monitoramento de transferências mais detalhados.

O DataSync usa um protocolo de rede especialmente criado e uma arquitetura com escalabilidade horizontal para transferir dados. Para a transferência de dados entre serviços on-premises e os do AWS Storage, uma única tarefa do DataSync é capaz de utilizar totalmente um link de rede de 10 Gbps.

O DataSync automatiza totalmente a transferência de dados. O serviço inclui mecanismos de novas tentativas e resiliência de rede, otimizações de rede, programadores de tarefas incorporados, monitoramento por meio da API e do console do DataSync e métricas, eventos e logs do CloudWatch, que fornecem visibilidade detalhada do processo de transferência. O DataSync executa verificação de integridade de dados durante e ao final da transferência.

O DataSync oferece segurança de ponta a ponta e se integra diretamente aos serviços de armazenamento da AWS. Todos os dados transferidos entre a origem e o destino são criptografados via TLS. O acesso ao armazenamento da AWS é habilitado mediante mecanismos de segurança incorporados da AWS, como funções do IAM. O DataSync com VPC endpoints são ativados para garantir que dados transferidos entre uma organização e a AWS não passem pela Internet pública, o que aumenta a segurança dos dados durante a cópia pela rede.

P: Para transferir objetos entre meus buckets, em que situações devo usar o AWS DataSync, o S3 Replication ou o S3 Batch Operations?

R: A AWS fornece várias ferramentas para copiar objetos entre seus buckets.

Use o AWS DataSync para distribuição contínua de dados, pipelines de dados e ingestão de data lake, bem como para consolidar ou dividir dados entre vários buckets.

Use o S3 Replication para replicação contínua de dados para um bucket de destino específico.

Use o S3 Batch Operations para operações em lote em grande escala em objetos do S3, como para copiar objetos, definir tags de objetos ou listas de controle de acesso (ACLs), iniciar restaurações de objetos provenientes do Amazon S3 Glacier, invocar uma função do AWS Lambda para executar ações personalizadas usando seus objetos, gerenciar a retenção legal do S3 Object Lock ou gerenciar datas de retenção do S3 Object Lock.

P:  Quando uso o AWS DataSync e quando uso o AWS Snowball Edge?

A: O AWS DataSync é ideal para transferências de dados on-line. Você pode usar o DataSync para migrar dados ativos para a AWS, transferir dados para a nuvem para análises e processamento, arquivar dados para liberar a capacidade de armazenamento on-premises ou replicar dados para a AWS para fins de continuidade de negócios.

O AWS Snowball Edge é ideal para transferências de dados offline, para clientes com restrições de largura de banda ou que transferem dados de ambientes remotos, desconectados ou severos. 

P:  Quando uso o AWS DataSync e quando uso o AWS Storage Gateway?

R: Use o AWS DataSync para migrar dados existentes para o Amazon S3, depois use a configuração do File Gateway do AWS Storage Gateway para manter o acesso a dados migrados e atualizações em vigor a partir das aplicações on-premises baseadas em arquivos.

Você pode usar uma combinação do DataSync e do File Gateway para minimizar sua infraestrutura on-premises e conectar de forma clara aplicações on-premises ao armazenamento na nuvem. O AWS DataSync permite que você automatize e acelere transferências de dados online para serviços de armazenamento da AWS. Após a fase inicial de transferência de dados usando o AWS DataSync, o File Gateway fornecerá aplicações on-premises com acesso de baixa latência para os dados transferidos. Ao usar o DataSync com compartilhamentos NFS, os metadados POSIX do armazenamento on-premises de origem são preservados, e as permissões do armazenamento de origem são aplicadas ao acessar seus arquivos usando o File Gateway.

P: Quando uso o AWS DataSync e quando uso o Amazon S3 Transfer Acceleration?

R: Se os aplicativos já estiverem integrados à API do Amazon S3 e você quiser aumentar a taxa de transferência pela migração de arquivos grandes para o S3, poderá usar o S3 Transfer Acceleration. Se você quiser transferir dados de sistemas de armazenamento existentes (por exemplo, Network Attached Storage) ou de instrumentos que não podem ser alterados (por exemplo, sequenciadores de DNA, câmeras de vídeo), ou se quiser usar vários destinos, use o AWS DataSync. Além disso, o DataSync automatiza e simplifica a transferência de dados fornecendo funcionalidades adicionais, como mecanismos incorporados de novas tentativas e resiliência, verificação de integridade de dados e configurações flexíveis, para atender a necessidades específicas como controle de utilização de largura de banda etc.

P: Quando uso o AWS DataSync e quando uso o AWS Transfer Family?

R: Se você já usa SFTP para intercâmbio de dados com terceiros, o AWS Transfer Family propicia transferência totalmente gerenciada via SFTP, FTPS e FTP diretamente de/para o Amazon S3, reduzindo a sobrecarga operacional.

Se quiser uma transferência de dados acelerada e automatizada entre servidores NFS, compartilhamentos de arquivos SMB, armazenamento de objeto autogerenciado, AWS Snowcone, Amazon S3, Amazon EFS e Amazon FSx for Windows File Server, você pode usar o AWS DataSync. O DataSync é ideal para clientes que precisam de migrações on-line para conjuntos de dados ativos, transferências em tempo hábil para dados gerados continuamente ou replicação para continuidade de negócios. 

Saiba mais sobre a definição de preço do DataSync
Saiba mais sobre a definição de preço

O AWS DataSync tem uma definição de preço simples, previsível e baseada no uso. Você paga apenas pela quantidade de dados copiada.  

Saiba mais 
Cadastre-se para obter uma conta da AWS
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

 

Cadastrar-se 
Comece a usar o DataSync no console
Comece a mover dados no Console

Comece a criar com o AWS DataSync no Console AWS.

Faça login