Publicado: Nov 4, 2021

Agora, o AWS DataSync oferece suporte à transferência de dados entre Hadoop Distributed File Systems (HDFS) e o Amazon S3, o Amazon Elastic File System (EFS) ou o Amazon FSx for Windows File Server. Usando o DataSync, você pode migrar de forma rápida, fácil e segura arquivos e pastas do HDFS no cluster do Hadoop para o armazenamento da AWS. Você também pode usar o DataSync para replicar dados no cluster do Hadoop para a AWS para continuidade de negócios, copiar dados para a AWS para preencher seus data lakes ou transferir dados entre o cluster e a AWS para análise e processamento.

O AWS DataSync é um serviço de transferência de dados online que oferece uma maneira simples de automatizar e acelerar a cópia de dados pela Internet ou com o AWS Direct Connect. O DataSync é rico em recursos com agendamento, monitoramento, criptografia e validação de integridade de dados integrados. O DataSync simplifica e automatiza o processo de cópia dos seus dados de e para a AWS, tudo com o modelo de preço com pagamento conforme o uso. Além do suporte ao HDFS, o DataSync também oferece suporte à cópia de dados entre compartilhamentos do Network File System (NFS), compartilhamentos do Server Message Block (SMB), armazenamento de objetos autogerenciado, AWS Snowcone, buckets do Amazon Simple Storage Service (Amazon S3), sistemas de arquivos do Amazon Elastic File System (Amazon EFS) e Amazon FSx for Windows File Server. Os agentes do DataSync são executados externamente ao cluster do Hadoop para que você possa acelerar suas migrações e simplificar as transferências de dados entre o cluster e a AWS, sem consumir recursos de computação e memória ou afetar seus processos de negócios.

O AWS DataSync está disponível em 23 regiões da AWS. Você pode saber mais sobre o serviço na documentação do DataSync ou pode fazer login no console do AWS DataSync para começar.