Aspectos generales

P: ¿Qué es AWS DataSync?

R: AWS DataSync es un servicio de transferencia de datos online que simplifica, automatiza y acelera la tarea de copiar grandes volúmenes de datos entre sistemas de almacenamiento y servicios de almacenamiento de AWS como Amazon S3 y Amazon EFS, mediante Internet o AWS Direct Connect.

P: ¿Por qué debería utilizar AWS DataSync?

R: AWS DataSync le permite transferir, copiar y sincronizar grandes conjuntos de datos con millones de archivos sin necesidad de crear soluciones personalizadas con herramientas de código abierto o autorizar y administrar un software costoso de aceleración de red comercial. Puede usar DataSync durante una transferencia única de datos activos, la distribución periódica de los flujos de trabajo de procesamiento de datos o la replicación continua para la continuidad empresarial.

P: ¿Qué problemas me resuelve AWS DataSync?

R: DataSync reduce la complejidad y el costo de la transferencia de datos en línea, simplificando la transferencia de conjuntos de datos entre los sistemas de almacenamiento local y Amazon S3 o Amazon Elastic File System (EFS). DataSync conecta los sistemas de almacenamiento existentes y los orígenes de datos con protocolos de almacenamiento estándar (NFS o SMB) y usa un protocolo de red personalizado y una arquitectura de escala ajustable para acelerar la transferencia hacia y desde AWS. DataSync escala y maneja de forma automática todas las tareas implicadas en el movimiento de datos, el control del progreso de las transferencias, el cifrado y la validación de las transferencias de datos y la notificación al cliente sobre cualquier falla. Con DataSync solo paga por la cantidad de datos copiados sin compromisos mínimos ni pagos iniciales.

P: ¿Desde y hacia dónde puedo transferir los datos?

R: DataSync puede copiar datos entre servidores NFS, archivos compartidos de SMB, buckets de Amazon S3 y sistemas de archivos de Amazon EFS.

P: ¿Puedo usar AWS DataSync para migrar datos a AWS?

R: Sí. Puede usar DataSync para realizar migraciones desde datos locales a Amazon S3, Amazon EFS y Amazon WorkDocs. Lea el blog de almacenamiento «Migración de almacenamiento con AWS DataSync» para obtener más información sobre las prácticas recomendadas de migración y consejos para realizar migraciones.

Configuración

P: ¿Cómo puedo comenzar a utilizar AWS DataSync?

R: Puede transferir los datos mediante DataSync con unos pocos clics en la consola de administración de AWS o mediante la interfaz de línea de comandos (CLI) de AWS. Para comenzar, implemente un agente de DataSync, configure las ubicaciones de almacenamiento de origen y destino, e inicie la copia.

P: ¿Cómo implemento un agente de AWS DataSync?

R: Debe implementar un agente de DataSync en el hipervisor VMware ESXi o en Amazon EC2. Para copiar datos en un servidor de archivos local o desde este, debe descargar la imagen de máquina virtual del agente ( un archivo OVA) de la consola de AWS e implementarla en su hipervisor VMware ESXi local. Para copiar datos en un servidor de archivos en la nube o desde este, puede crear una instancia de Amazon EC2 a partir del agente AMI provisto en la consola de AWS. En ambos casos, el agente se debe implementar para que pueda obtener acceso a su servidor de archivos por medio del protocolo NFS o SMB.

P: ¿Cuáles son los recursos necesarios para ejecutar el agente de AWS DataSync?

R: Los recursos mínimos que necesita para ejecutar el agente se pueden consultar aquí.

Uso

P: ¿Cómo uso AWS DataSync?

R: Para utilizar DataSync, siga los 3 pasos que se indican a continuación:

1. Implemente un agente: implemente un agente de DataSync y asócielo con su cuenta de AWS mediante la consola de administración o la API. El agente se usará para obtener acceso a su servidor NFS o a sus archivos compartidos de SMB para leer sus datos o escribir en ellos.

2. Cree una tarea de transferencia de datos – Cree una tarea mediante la especificación de la ubicación del origen y el destino de los datos, y cualquier opción que desee usar para configurar la transferencia, como copiar metadatos de archivos.

3. Inicie la transferencia: inicie la tarea y controle la migración de los datos en la consola o con Amazon CloudWatch.

P: ¿Cómo inicio una tarea de AWS DataSync?

R: DataSync copia los datos cuando se inicia una tarea mediante la consola de administración de AWS o la interfaz de línea de comandos (CLI) de AWS. Cada vez que se ejecuta una tarea, el servicio escanea el origen buscando cambios y realiza una copia de cualquier diferencia entre el origen y el destino. Puede configurar qué características del origen se usarán para determinar las diferencias, definir filtros para incluir y excluir archivos o carpetas específicos y controlar si los archivos u objetos en el destino deben eliminarse cuando no se encuentren en el origen.

P: ¿Cómo se asegura AWS DataSync de que mis archivos se hayan copiado correctamente? ¿Cómo se realiza la validación de datos por medio de AWS DataSync?

R: Como DataSync transfiere y almacena datos, realiza controles de integridad para garantizar que los datos escritos en el destino coincidan con los datos leídos en el origen. Además, puede realizar un paso de validación adicional después de completar todas las transferencias para garantizar que el destino sea una copia exacta del origen. Esto se lleva a cabo calculando y comparando sumas de comprobación completas para todos los archivos, sin importar cuáles de ellos hayan sido transferidos por DataSync.

P: ¿Cómo puedo controlar el estado de los datos que AWS DataSync está transfiriendo?

R: Puede usar la consola de administración de AWS o la CLI para controlar el estado de los datos que se están transfiriendo. Con las métricas de Amazon CloudWatch, puede ver la cantidad de archivos y de datos que se ha copiado. Puede consultar los registros de Amazon CloudWatch Logs para leer información detallada sobre los errores. Además, los eventos de CloudWatch se activan a medida que sus tareas cambian de estado, lo que permite automatizar los flujos de trabajo dependientes. Puede obtener información adicional, como el progreso de la transferencia, en la consola de administración de AWS o la CLI.

P: ¿Cómo hace AWS DataSync para convertir archivos y carpetas desde o hacia objetos en Amazon S3?

R: Cuando los archivos o las carpetas se copian a Amazon S3, existe una relación de uno a uno entre un archivo o una carpeta y un objeto. Las marcas de tiempo de los metadatos de los archivos y las carpetas y los permisos POSIX, que incluyen ID de usuarios, ID de grupos y permisos, se almacenan en los metadatos de los usuarios de S3. Los metadatos de archivos almacenados en los metadatos de usuario en S3 son interoperables con el gateway de archivos y permiten que DataSync realice un acceso local basado en archivos a los datos almacenados en Amazon S3.

Cuando DataSync realiza copias desde un servidor NFS, los permisos de POSIX de los archivos y las carpetas en el origen se almacenan en los metadatos del usuario de S3. Cuando se realiza una copia desde un archivo compartido de SMB, los permisos POSIX predeterminados se almacenan en los metadatos del usuario de S3.

Cuando DataSync vuelve a copiar objetos que contienen los metadatos de este usuario en el servidor NFS, los metadatos del archivo se restauran. Cuando se vuelve a realizar una copia en un archivo compartido de SMB, el propietario se establece según el usuario que estaba habilitado para acceder a ese archivo compartido en DataSync y se le asignan permisos predeterminados.

Consulte nuestra documentación sobre la manera en que DataSync almacena archivos y metadatos para obtener más información.

P: ¿Puedo usar el control de versiones, el ciclo de vida, la replicación entre regiones y la notificación de eventos de S3 con AWS DataSync?

R: Sí. Sus políticas de bucket para el control de versiones, la administración del ciclo de vida, la replicación entre regiones y la notificación de eventos de S3 se aplican directamente a los objetos transferidos a su bucket mediante DataSync.

Cuando usa las versiones, tenga en cuenta que los cambios a los metadatos de objeto crearán una nueva versión del objeto.

Puede usar las políticas de ciclo de vida de S3 para cambiar la capa de almacenamiento de un objeto o eliminar objetos o versiones de objetos antiguos.

P: ¿Qué sucede si se interrumpe una tarea de AWS DataSync?

R: Si se interrumpe una tarea (por ejemplo, si la conexión de red falla o el agente de DataSync se reinicia), la siguiente ejecución de la tarea transferirá los archivos faltantes y los datos estarán completos y serán congruentes al finalizar la ejecución. Cada vez que se inicia una tarea, se realiza una copia gradual y se transfieren únicamente los cambios desde el origen al destino.

P: ¿Puedo usar AWS DataSync con AWS Direct Connect?

R: Sí. Puede utilizar DataSync con su enlace de Direct Connect para obtener acceso a los puntos de enlace de los servicios públicos o los puntos de enlace de la VPC privados mediante AWS PrivateLink.

P: ¿AWS DataSync admite los puntos de enlace de la VPC o de AWS PrivateLink?

R: Sí. Puede utilizar los puntos de enlace de la VPC para garantizar que la transferencia de datos entre su agente de DataSync, implementado de forma local o en la nube, no atraviese redes públicas de Internet ni requiera el uso de direcciones de IP públicas. El uso de los puntos de enlace de la VPC aumenta la seguridad de sus datos ya que mantiene el tráfico de la red dentro de su Amazon Virtual Private Cloud (Amazon VPC). Los puntos de enlace de la VPC para DataSync funcionan con AWS PrivateLink, una tecnología escalable de alta disponibilidad que le permite conectar de forma privada su VPC a los servicios de AWS compatibles.

P: ¿Cómo configuro AWS DataSync para poder utilizar los puntos de enlace de la VPC?

R: Para poder utilizar los puntos de enlace de la VPC con DataSync, debe crear un punto de enlace de la VPC de interfaz AWS PrivateLink para el servicio DataSync en la VPC de su elección y, a continuación, elegir esta interfaz de red elástica (ENI) de punto de enlace al momento de crear el agente de DataSync. El agente se conectará con esta ENI para activarse y, posteriormente, todos los datos transferidos por el agente permanecerán dentro de la VPC que configuró. Puede utilizar la consola de AWS DataSync, la interfaz de línea de comandos de AWS (CLI) o AWS SDK para configurar los puntos de enlace de la VPC. Para obtener más información, consulte Utilizar AWS DataSync en una nube virtual privada.

P: ¿AWS DataSync conserva la estructura del directorio de origen cuando transfiere archivos?

R: Sí. Cuando transfiere archivos, DataSync crea una estructura de directorio en el destino que es similar a la estructura de la ubicación de origen.

Rendimiento

P: ¿Con qué velocidad AWS DataSync copia mi sistema de archivos a AWS?

R: La velocidad con la cual DataSync puede copiar un conjunto de datos determinado depende de la cantidad de datos, del ancho de banda de E/S que se puede alcanzar desde el origen y el almacenamiento de destino, del ancho de banda de red disponible y de las condiciones de la red. Un solo agente de DataSync es capaz de saturar un enlace de red de 10 Gbps.

P: ¿Puedo controlar la cantidad de ancho de banda de red que puede usar una tarea de AWS DataSync?

R: Sí. Puede controlar la cantidad de ancho de banda de red que DataSync usará. Para ello, configure el acelerador de ancho de banda incorporado. Esto puede ayudar a minimizar el impacto en los demás usuarios o aplicaciones que utilizan la misma conexión de red.

P: ¿AWS DataSync afectará el rendimiento de mi sistema de archivos de origen?

R: Según la capacidad del almacén de archivos local y la cantidad y el tamaño de los archivos a transferir, DataSync podría afectar el tiempo de respuesta de los demás clientes cuando obtengan acceso al mismo almacén de datos de origen debido a que el agente lee o escribe los datos desde dicho sistema de almacenamiento. Configurar un límite de ancho de banda para una tarea reducirá este impacto al restringir las operaciones de E/S que se realizarán en su sistema de almacenamiento.

Seguridad y conformidad

P: ¿Se cifran mis datos a medida que se transfieren y almacenan?

R: Sí. Todos los datos transferidos entre el origen y el destino se cifran mediante Transport Layer Security (TLS, que reemplazó a Secure Sockets Layer, SSL) Los datos nunca persisten en DataSync por sí mismos. El servicio admite el uso de cifrado predeterminado para los buckets de S3 y el cifrado de los datos en reposo del sistema de archivos Amazon EFS.

P: ¿Cómo accede AWS DataSync a mi servidor NFS o a mis archivos compartidos de SMB?

R: DataSync usa un agente que usted implementa en su entorno de TI o en Amazon EC2 para obtener acceso a sus archivos mediante el protocolo NFS o el protocolo SMB. Estos agentes se conectan con los puntos de enlace del servicio DataSync dentro de AWS y, una vez que están activados, se administran de manera segura a partir de la consola de administración de AWS o la CLI. Cuando se copien datos hacia o desde las instalaciones, no hay necesidad de configurar una VPN o un túnel ni de habilitar conexiones entrantes y los agentes se pueden configurar para direccionarse mediante un firewall con los puertos de red estándar.

P: ¿Cómo se conectan los agentes de AWS DataSync con AWS?

R: Los agentes de DataSync se conectan con los puntos de enlace del servicio dentro de la región de AWS elegida. Cuando crea un agente, puede elegir que el agente se conecte con la Internet pública y enfrente los puntos de enlace, los puntos de enlace validados según las Normas federales de procesamiento de la información (FIPS) o los puntos de enlace dentro de una de sus VPC. Para obtener más información, consulte Elegir un punto de enlace del servicio.

P: ¿Cómo obtiene acceso AWS DataSync a mi bucket de Amazon S3?

R: DataSync accede a su bucket de Amazon S3 usando el rol de IAM que usted configura.

P: ¿Cómo obtiene acceso AWS DataSync a mi sistema de archivos Amazon EFS?

R: DataSync obtiene acceso a su sistema de archivos Amazon EFS mediante el protocolo NFS. Lo hace al organizar su sistema de archivos desde su VPC desde interfaces de red elásticas (ENI) que administra el servicio DataSync. DataSync se encarga de administrar por completo la creación, el uso y la eliminación de estas ENI por usted.

P: ¿A qué programas de conformidad adhiere AWS DataSync?

R: AWS tiene el programa de conformidad de mayor duración en la nube y está comprometido a ayudar a los clientes a explorar sus requisitos. DataSync ha sido evaluado para verificar el cumplimiento de estándares de seguridad globales y del sector. Cumple con los requisitos de PCI DSS, ISO 9001, 27001, 27017 y 27018,SOC 1, 2 y 3 y de la ley HIPAA. Esto le facilita la verificación de nuestra seguridad y el cumplimiento de sus propias obligaciones. Si desea obtener más información y recursos, visite las páginas sobre temas de conformidad. También puede ir a la página Servicios de AWS en el ámbito del programa de conformidad para ver una lista completa de servicios y certificaciones.

P: ¿AWS DataSync cumple los requisitos normativos de PCI?

R: Sí. DataSync está en conformidad con PCI-DSS, lo que significa que puede usarlo para transferir información de pago. Puede descargar el Paquete de conformidad con PCI en AWS Artifact para obtener más información sobre cómo lograr la conformidad con PCI en AWS.

P: ¿AWS DataSync es compatible con HIPAA?

R: Sí. DataSync es compatible con HIPAA, lo que significa que, si tiene un HIPAA BAA establecido con AWS, puede usar DataSync para transferir información protegida de salud (PHI).

Cuándo elegir AWS DataSync

P: ¿Qué diferencias existen entre AWS DataSync y el uso de herramientas de línea de comandos como rsync o S3 sync?

R: A diferencia de las soluciones "de creación propia" basadas en herramientas de línea de comandos, DataSync proporciona transferencias de datos automatizadas y completamente administradas. El servicio utiliza una arquitectura de escala ajustable y un protocolo de red personalizado para transferir datos con una velocidad 10 veces superior.

Específicamente, DataSync automatiza por completo la transferencia de datos. Incluye mecanismos integrados de resiliencia de red y repetición de intentos, monitorización a través de la consola y la API de DataSync, y registros, eventos y métricas de CloudWatch que ofrecen una visibilidad detallada sobre el proceso de transferencia. DataSync realiza una verificación de la integridad de los datos tanto durante la transferencia como al momento de su finalización. El servicio también permite realizar configuraciones flexibles para adaptarse a sus necesidades específicas, como límites de ancho de banda, copias de metadatos y permisos de origen, etc.

DataSync ofrece protección integral: todos los datos transferidos entre el origen y el destino se cifran con TLS y el acceso a su almacenamiento de AWS se activa mediante mecanismos de seguridad de AWS integrados, como roles de IAM.

P: ¿Cómo determino cuándo debo usar AWS DataSync y AWS Snowball Edge?

R: AWS Snowball Edge es adecuado para los clientes que no necesitan almacenar sus datos en AWS inmediatamente, tienen restricciones de ancho de banda o transfieren los datos desde entornos remotos, sin conexión a Internet o limitados. DataSync es ideal para los clientes que necesitan realizar migraciones online de conjuntos de datos activos, transferencias a tiempo de datos que se generan de manera continua o replicaciones destinadas a conservar la continuidad empresarial.

P: ¿Cómo determino cuándo debo usar AWS DataSync y AWS Storage Gateway?

R: Si necesita transferir datos entre un entorno local y un servicio de almacenamiento de AWS como S3 o EFS, debe usar DataSync. Normalmente, DataSync se utiliza para migraciones de almacenamientos o para transferencias recurrentes a tiempo de datos desde dispositivos locales, como cámaras e instrumentos, para su posterior procesamiento en AWS. Si necesita un acceso de baja latencia desde entornos locales a datos que se encuentran en AWS, debe usar AWS Storage Gateway. Storage Gateway se utiliza habitualmente para copias de seguridad, cargas de trabajo híbridas, aplicaciones locales vulnerables a la latencia, distribución de contenido entre oficinas y acceso basado en archivos a objetos almacenados en S3.

Mediante la combinación de DataSync y la configuración de File Gateway de Storage Gateway, puede migrar rápidamente su almacenamiento local a AWS y, al mismo tiempo, conservar el acceso local para aplicaciones vulnerables a la latencia.

P: ¿Cómo determino cuándo debo usar AWS DataSync y Amazon S3 Transfer Acceleration?

R: Si sus aplicaciones ya se han integrado con la API de Amazon S3 y quiere un mayor rendimiento para transferir archivos grandes a S3, puede usar S3 Transfer Acceleration. Use DataSync si quiere transferir los datos desde sus sistemas de almacenamiento existentes (por ejemplo, un almacenamiento conectado a la red), desde los instrumentos que no pueden cambiarse (por ejemplo, secuenciadores de ADN, cámaras de video) o si quiere usar varios destinos. DataSync también automatiza y simplifica la transferencia de datos mediante el suministro de funcionalidades adicionales, como los mecanismos integrados de resiliencia de red y repetición de intentos, la verificación de la integridad de los datos y la configuración flexible para adaptarse a sus necesidades específicas, incluido el límite de ancho de banda y la copia de permisos y metadatos del origen, etc.

P: ¿Cómo determino cuándo debo usar AWS DataSync y AWS Transfer for SFTP?

R: Si actualmente utiliza SFTP para intercambiar datos con terceros, Transfer for SFTP le ofrece una transferencia SFTP completamente administrada y directa hacia y desde Amazon S3, mientras reduce la carga operativa.

Si desea realizar una transferencia de datos automatizada y agilizada entre un servidor NFS, archivos compartidos de SMB, Amazon S3 y Amazon EFS, puede usar DataSync. DataSync es ideal para los clientes que necesitan realizar migraciones online de conjuntos de datos activos, transferencias a tiempo de datos que se generan de manera continua o replicaciones destinadas a conservar la continuidad empresarial. 

P: ¿AWS DataSync me permite migrar a WorkDocs?

R: Sí. R: DataSync forma parte del servicio de migraciones de WorkDocs. DataSync facilita y agiliza la migración de directorios principales y archivos compartidos de departamentos a WorkDocs.

Más información sobre los precios de DataSync
Más información acerca de los precios

AWS DataSync tiene precios simples, predecibles, con base en el uso y pasa solo por la cantidad de datos que copia.  

Más información 
Regístrese para abrir una cuenta de AWS
Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS. 

Registrarse 
Comience a usar DataSync en la consola
Comience a migrar datos en la consola

Comience a crear con AWS DataSync en la consola de AWS.

Iniciar sesión