Publicado en: Nov 4, 2021
AWS DataSync ya es compatible con la transferencia de datos entre Hadoop Distributed File Systems (HDFS) y Amazon S3, Amazon Elastic File System (EFS) o Amazon FSx for Windows File Server. Con DataSync, puede migrar archivos y carpetas de forma rápida, sencilla y segura desde HDFS en su clúster de Hadoop al almacenamiento de AWS. También puede utilizar DataSync para replicar datos en su clúster de Hadoop a AWS con fines de continuidad empresarial, copiar datos a AWS para poblar sus lagos de datos o transferir datos entre su clúster y AWS para su análisis y procesamiento.
AWS DataSync es un servicio de transferencia de datos en línea que le brinda una forma sencilla de automatizar y acelerar la copia de datos a través de Internet o con AWS Direct Connect. DataSync cuenta con una gran cantidad de funciones, como la programación, el monitoreo, la encriptación y la validación de la integridad de los datos. DataSync simplifica y automatiza el proceso de copia de los datos a y desde AWS, todo ello con precios de pago por uso. Además de la compatibilidad con HDFS, DataSync también es compatible con la copia de entre recursos compartidos del sistema de archivos de red (NFS), recursos compartidos de bloques de mensajes de servidor (SMB), el almacenamiento de objetos autoadministrados, AWS Snowcone, los buckets de Amazon Simple Storage Service (Amazon S3), los sistemas de archivos de Amazon Elastic File System (Amazon EFS) y los sistemas de archivos de Amazon FSx for Windows File Server. Los agentes de DataSync se ejecutan de forma externa a al clúster de Hadoop para que pueda acelerar las migraciones y simplificar las transferencias de datos entre el clúster y AWS, sin consumir recursos informáticos y de memoria ni afectar a los procesos empresariales.
AWS DataSync está disponible en 23 regiones de AWS. Puede obtener más información sobre el servicio, en la documentación de DataSync, o puede iniciar sesión en la consola de AWS DataSync para comenzar a trabajar.