Aspectos generales

P: ¿Qué es AWS DataSync?

R: AWS DataSync es un servicio de transferencia de datos online que simplifica, automatiza y acelera la tarea de copiar grandes volúmenes de datos entre sistemas de almacenamiento y servicios de almacenamiento de AWS como Amazon S3 y Amazon EFS, mediante Internet o AWS Direct Connect.

P: ¿Por qué debería utilizar AWS DataSync?

R: AWS DataSync le permite transferir, copiar y sincronizar grandes conjuntos de datos con millones de archivos sin necesidad de crear soluciones personalizadas con herramientas de código abierto o autorizar y administrar un software costoso de aceleración de red comercial. Puede usar DataSync durante una transferencia única de datos activos, la distribución periódica de los flujos de trabajo de procesamiento de datos o la replicación continua para la continuidad empresarial.

P: ¿Qué problemas me resuelve DataSync?

R: DataSync reduce la complejidad y el costo de la transferencia de datos online, lo que simplifica la transferencia de conjuntos de datos entre los sistemas de almacenamiento locales y Amazon S3 o Amazon Elastic File System (EFS). DataSync conecta los sistemas de almacenamiento existentes y los orígenes de datos con un protocolo de almacenamiento estándar (NFS) y usa un protocolo de red personalizado y una arquitectura de escala ajustable para acelerar la transferencia hacia y desde AWS. DataSync escala y maneja de forma automática todas las tareas implicadas en el movimiento de los datos, el control del progreso de las transferencias, el cifrado y la validación de las transferencias de datos y la notificación al cliente sobre cualquier falla. Con DataSync solo paga por la cantidad de datos copiados sin compromisos mínimos ni pagos iniciales.

P: ¿Desde y hacia dónde puedo transferir los datos?

R: DataSync puede copiar datos entre servidores NFS, buckets de Amazon S3 y sistemas de archivos de Amazon EFS.

Configuración

P: ¿Cómo comienzo a usar DataSync?

R: Puede transferir los datos mediante DataSync con unos pocos clic en la consola de administración de AWS o mediante la interfaz de línea de comandos (CLI) de AWS. Para comenzar, implemente un agente de DataSync, configure la ubicación de almacenamiento de origen y destino, e inicie la copia.

P: ¿Cómo implemento un agente de DataSync?

R: Debe implementar un agente de DataSync en el hipervisor VMware ESXi o en Amazon EC2. Para copiar datos en un servidor NFS local o desde este, debe descargar el OVA de la consola de AWS e implementarlo en su hipervisor VMware ESXi local. Para copiar datos en un servidor NFS en la nube o desde este, puede crear una instancia de Amazon EC2 a partir de la AMI provista. En ambos casos, el agente se debe implementar para que pueda obtener acceso a su servidor NFS.

P: ¿Cuáles son los recursos necesarios para ejecutar el agente de DataSync?

R: Los recursos mínimos que necesita para ejecutar el agente se pueden consultar aquí.

Uso

P: ¿Cómo utilizo DataSync?

R: Siga los 3 pasos que se describen a continuación para utilizar DataSync:

1. Implemente un agente: implemente un agente de DataSync y asócielo con su cuenta de AWS mediante la consola de administración o la API. El agente se usará para obtener acceso a su servidor NFS desde el cual se leerán datos o donde se los escribirá.

2. Cree una tarea de transferencia de datos – Cree una tarea mediante la especificación de la ubicación del origen y el destino de los datos, y cualquier opción que desee usar para configurar la transferencia, como copiar metadatos de archivos.

3. Inicie la transferencia – Inicie la tarea y controle la migración de los datos en la consola o con Amazon CloudWatch.

P: ¿Cómo inicio una tarea de DataSync?

R: DataSync copia los datos cuando se inicia una tarea mediante la consola de administración de AWS o la interfaz de línea de comandos (CLI) de AWS. Cada vez que se ejecuta una tarea, el servicio escanea el origen buscando cambios y realiza una copia de cualquier diferencia entre el origen y el destino. Puede configurar qué características del origen se usarán para determinar las diferencias, definir filtros para incluir y excluir archivos o carpetas específicos y controlar si los archivos u objetos en el destino deben eliminarse cuando no se encuentren en el origen.

P: ¿Cómo realiza DataSync la validación de la integridad de los datos?

R: DataSync realiza la verificación de la integridad de los datos tanto durante como al final de la transferencia (comparación de la suma de comprobación entre los archivos de origen y destino, como así también de los metadatos del archivo).

P: ¿Cómo puedo controlar el estado de los datos que DataSync está transfiriendo?

R: Puede usar la consola de administración de AWS o la CLI para controlar el estado de los datos que se están transfiriendo. Con las métricas de Amazon CloudWatch, puede ver la cantidad de archivos y de datos que se ha copiado. Puede consultar los registros de Amazon CloudWatch Logs para leer información detallada sobre los errores. Además, los eventos de CloudWatch se activan a medida que sus tareas cambian de estado, lo que permite automatizar los flujos de trabajo dependientes. Puede obtener información adicional, como el progreso de la transferencia, en la consola de administración de AWS o la CLI.

P: Al transferir los archivos desde o hacia Amazon S3, ¿cómo hace DataSync para establecer correspondencias entre los archivos y los objetos?

R: Cuando los archivos se copian a los objetos, existe una relación de uno a uno entre un archivo y un objeto. Los metadatos del sistema de archivos se almacenan en los metadatos de usuario de S3. Los metadatos se recuperan cuando los objetos que contienen los metadatos del sistema de archivos se copian de nuevo a los archivos.

P: ¿Qué metadatos preserva DataSync cuando transfiere los datos?

R: DataSync preserva los metadatos de POSIX, como el ID de usuario, el ID de grupo y los permisos, para garantizar que los archivos se puedan restaurar a su ubicación original sin perder datos de estos metadatos. Además, al almacenar los metadatos de POSIX desde los archivos para los objetos en S3, los metadatos son interoperables con File Gateway.

P: ¿Puedo usar el control de versiones, el ciclo de vida, la replicación entre regiones y la notificación de eventos de S3 con DataSync?

R: Sí. Sus políticas de bucket para el control de versiones, la administración del ciclo de vida, la replicación entre regiones y la notificación de eventos de S3 se aplican directamente a los objetos transferidos a su bucket mediante DataSync.

Cuando usa las versiones, tenga en cuenta que los cambios a los metadatos de objeto crearán una nueva versión del objeto.

Puede usar las políticas de ciclo de vida de S3 para cambiar la capa de almacenamiento de un objeto o eliminar objetos o versiones de objetos antiguos.

P: ¿Qué sucede si se interrumpe una tarea de DataSync

R: Si se interrumpe una tarea (por ejemplo, si la conexión de red falla o el agente de DataSync se reinicia), la siguiente ejecución de la tarea transferirá los archivos faltantes y los datos estarán completos y serán congruentes al finalizar la ejecución. Cada vez que se inicia una tarea, se realiza una copia gradual y se transfieren únicamente los cambios desde el origen al destino.

P: ¿Puedo usar DataSync con AWS Direct Connect?

R: Sí. Puede usar DataSync con su enlace de Direct Connect para obtener acceso a los puntos de enlace de Internet públicos sin ninguna configuración especial.

P: ¿DataSync conserva la estructura del directorio de origen cuando transfiere archivos?

R: Sí, cuando transfiere archivos, DataSync crea una estructura de directorio en el destino que es similar a la estructura de la ubicación de origen.

Rendimiento

P: ¿Con qué velocidad DataSync copia mi sistema de archivos a AWS?

R: La velocidad con la cual DataSync puede copiar un conjunto de datos determinado depende de la cantidad de datos, el ancho de banda de E/S que se puede alcanzar desde el origen y el almacenamiento de destino, el ancho de banda de red disponible y las condiciones de la red. Un solo agente de DataSync es capaz de saturar un enlace de red de 10 Gbps.

P: ¿Puedo controlar la cantidad de ancho de banda de red que puede usar una tarea de DataSync?

R: Sí, puede controlar la cantidad de ancho de banda de red que DataSync usará. Para ello, configure el acelerador de ancho de banda incorporado. Esto puede ayudar a minimizar el impacto en los demás usuarios o aplicaciones que utilizan la misma conexión de red.

P: ¿DataSync afectará el rendimiento de mi sistema de archivos de origen?

R: Según la capacidad de almacén de archivos local y la cantidad y el tamaño de los archivos a transferir, DataSync podría afectar el tiempo de respuesta de los demás clientes cuando obtengan acceso al mismo almacén de datos de origen debido a que el agente lee o escribe los datos desde dicho sistema de almacenamiento. Configurar un límite de ancho de banda para una tarea reducirá este impacto al restringir las operaciones de E/S que se realizarán en su sistema de almacenamiento.

Seguridad y conformidad

P: ¿Se cifran mis datos a medida que se transfieren y almacenan?

R: Sí. Todos los datos transferidos entre el origen y el destino se cifran mediante Transport Layer Security (TLS, que reemplazó a Secure Sockets Layer, SSL) Los datos nunca persisten en DataSync por sí mismos. El servicio admite el uso de cifrado predeterminado para los buckets de S3 y el cifrado de los datos en reposo del sistema de archivos Amazon EFS.

P: ¿De qué manera DataSync obtiene acceso a mi sistema de archivos NFS?

R: DataSync usa un agente que usted implementa en su entorno de TI o en Amazon EC2 para obtener acceso a sus sistemas de archivos mediante el protocolo NFS. Estos agentes se conectan con los puntos de enlace del servicio DataSync dentro de AWS y, una vez que están activados, se administran de manera segura a partir de la consola de administración de AWS o la CLI. Cuando se copien datos hacia o desde entornos locales, no hay necesidad de configurar una VPN o un túnel ni de habilitar conexiones entrantes y los agentes se pueden configurar para direccionarse mediante un firewall con los puertos de red estándar.

P: ¿Cómo obtiene acceso DataSync a mi bucket de Amazon S3?

R: DataSync accede a su bucket de Amazon S3 usando la función de IAM que usted configura.

P: ¿Cómo obtiene acceso DataSync a mi sistema de archivos Amazon EFS?

R: DataSync obtiene acceso a su sistema de archivos Amazon EFS mediante el protocolo NFS. Lo hace al organizar su sistema de archivos desde su VPC desde interfaces de red elásticas (ENI) que administra el servicio DataSync. DataSync se encarga de administrar por completo la creación, el uso y la eliminación de estas ENI por usted.

P: ¿A qué programas de conformidad adhiere DataSync?

R: AWS tiene un programa de conformidad de la más duradera ejecución y está comprometido con ayudar a los clientes a que naveguen sus requisitos. DataSync se evaluó para verificar el cumplimiento de estándares de seguridad globales y del sector. Cumple con los requisitos de PCI DSS, ISO 9001, 27001, 27017 y 27018,SOC 1, 2 y 3 y de la ley HIPAA. Esto le facilita la verificación de nuestra seguridad y el cumplimiento de sus propias obligaciones. Si desea obtener más información y recursos, visite las páginas sobre temas de conformidad. También puede consultar la página de servicios dentro del alcance por programa de conformidad para ver una lista completa de servicios y certificaciones.

P: ¿DataSync cumple los requisitos normativos de PCI?

R: Sí. DataSync está en conformidad con PCI-DDS, lo que significa que puede usarlo para transferir información de pago. Puede descargar el Paquete de conformidad PCI en AWS Artifact para obtener más información sobre cómo alcanzar la conformidad PCI en AWS.

P: ¿DataSync es compatible con HIPAA?

R: Sí. DataSync es compatible con HIPAA, lo que significa que tiene un HIPAA BAA establecido con AWS, puede usar DataSync para transferir información protegida de salud (PHI).

Cuándo elegir AWS DataSync

P: ¿Qué diferencias existen entre DataSync y utilizar herramientas de línea de comandos como rsync o S3 sync?

R: A diferencia de las soluciones "hágalo usted mismo" basadas en herramientas de línea de comandos, DataSync provee transferencias de datos automatizadas y completamente administradas. El servicio utiliza una arquitectura de escala ajustable y un protocolo de red personalizado para transferir datos con una velocidad 10 veces superior.

Específicamente, DataSync automatiza por completo la transferencia de datos. Incluye mecanismos integrados de resiliencia de red y repetición de intentos, monitorización a través de la consola y la API de DataSync, y registros, eventos y métricas de CloudWatch que ofrecen una visibilidad detallada sobre el proceso de transferencia. DataSync realiza una verificación de la integridad de los datos tanto durante la transferencia como al momento de su finalización. El servicio también permite realizar configuraciones flexibles para adaptarse a sus necesidades específicas, como límites de ancho de banda, copias de metadatos y permisos de origen, etc.

DataSync ofrece protección integral: todos los datos transferidos entre el origen y el destino se cifran con TLS y el acceso a su almacenamiento de AWS se activa mediante mecanismos de seguridad de AWS integrados, como roles de IAM.

P: ¿Cómo determino cuándo debo usar AWS DataSync y AWS Snowball Edge?

R: AWS Snowball Edge es adecuado para los clientes que no necesitan almacenar sus datos en AWS inmediatamente, tienen restricciones de ancho de banda o transfieren los datos desde entornos remotos, sin conexión a Internet o limitados. DataSync es ideal para los clientes que necesitan realizar migraciones online de conjuntos de datos activos, transferencias a tiempo de datos que se generan de manera continua o replicaciones destinadas a conservar la continuidad empresarial.

P: ¿Cómo determino cuándo debo usar AWS DataSync y AWS Storage Gateway?

R: Si necesita transferir datos entre un entorno local y un servicio de almacenamiento de AWS como S3 o EFS, debe usar DataSync. Normalmente, DataSync se utiliza para migraciones de almacenamientos o para transferencias recurrentes a tiempo de datos desde dispositivos locales, como cámaras e instrumentos, para su posterior procesamiento en AWS. Si necesita un acceso de baja latencia desde entornos locales a datos que se encuentran en AWS, debe usar AWS Storage Gateway. Storage Gateway se utiliza habitualmente para copias de seguridad, cargas de trabajo híbridas, aplicaciones locales vulnerables a la latencia, distribución de contenido entre oficinas y acceso basado en archivos a objetos almacenados en S3.

Mediante la combinación de DataSync y la configuración de File Gateway de Storage Gateway, puede migrar rápidamente su almacenamiento local a AWS y, al mismo tiempo, conservar el acceso local para aplicaciones vulnerables a la latencia.

P: ¿Cómo determino cuándo debo usar AWS DataSync y Amazon S3 Transfer Acceleration?

R: Si sus aplicaciones ya se han integrado con la API de Amazon S3 y quiere un mayor rendimiento para transferir archivos grandes a S3, puede usar S3 Transfer Acceleration. Use DataSync si quiere transferir los datos desde sus sistemas de almacenamiento existentes (por ejemplo, un almacenamiento conectado a la red), desde los instrumentos que no pueden cambiarse (por ejemplo, secuenciadores de ADN, cámaras de video) o si quiere usar varios destinos. DataSync también automatiza y simplifica la transferencia de datos mediante el suministro de funcionalidades adicionales, como los mecanismos integrados de resiliencia de red y repetición de intentos, la verificación de la integridad de los datos y la configuración flexible para adaptarse a sus necesidades específicas, incluido el límite de ancho de banda y la copia de permisos y metadatos del origen, etc.

P: ¿Cómo determino cuándo debo usar AWS DataSync y AWS Transfer for SFTP?

R: Si actualmente utiliza SFTP para intercambiar datos con terceros, Transfer for SFTP le ofrece una transferencia SFTP completamente administrada hacia y desde Amazon S3, mientras reduce la carga operativa.

Si desea realizar una transferencia de datos automatizada y agilizada entre NFS, Amazon S3 y Amazon EFS, puede usar DataSync. DataSync es ideal para los clientes que necesitan realizar migraciones en línea de conjuntos de datos activos, transferencias a tiempo de datos que se generan de manera continua o replicaciones destinadas a conservar la continuidad empresarial. 

Usar DataSync para migraciones

P: ¿Cómo utilizo DataSync para migraciones?

R: Puede usar DataSync para realizar migraciones desde almacenamientos locales a Amazon S3, Amazon EFS y WorkDocs. Haga clic aquí para obtener más información acerca del flujo de migración recomendado.

P: ¿Cómo puedo usar DataSync para realizar migraciones a WorkDocs?

R: DataSync forma parte del servicio de migraciones de WorkDocs. DataSync facilita y agiliza la migración de directorios principales y archivos compartidos de departamentos a WorkDocs.

Más información sobre los precios de DataSync
Más información acerca de los precios

AWS DataSync tiene precios simples, predecibles, con base en el uso y pasa solo por la cantidad de datos que copia.  

Más información 
Regístrese para abrir una cuenta de AWS
Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS. 

Registrarse 
Comience a usar DataSync en la consola
Comience a migrar datos en la consola

Comience a crear con AWS DataSync en la consola de AWS.

Iniciar sesión