Aspectos generales

P: ¿Qué es AWS DataSync?

R: AWS DataSync es un servicio administrado de transferencia de datos en línea que simplifica, automatiza y acelera el movimiento y la replicación de grandes cantidades de datos entre los sistemas de almacenamiento locales y los servicios de almacenamiento de AWS como Amazon S3 y Amazon EFS, sobre Internet o AWS Direct Connect.

P: ¿Por qué debo utilizar DataSync?

R: AWS DataSync le permite transferir, copiar y sincronizar grandes conjuntos de datos con millones de archivos sin necesidad de crear soluciones personalizadas con herramientas de código abierto o autorizar y administrar un software costoso de aceleración de red comercial. Puede usar DataSync durante una transferencia única de datos activos, la distribución periódica de los flujos de trabajo de procesamiento de datos o la replicación continua para la continuidad empresarial.

P: ¿Qué problemas me resuelve DataSync?

R: DataSync reduce la complejidad y el costo de la transferencia de datos en línea, simplificando la transferencia del conjuntos de datos entre los sistemas de almacenamiento local y Amazon S· o Amazon Elastic File System (EFS). DataSync conecta los sistemas de almacenamiento existentes y las fuentes de datos con un protocolo de almacenamiento estándar (NFS) y usa un protocolo de red personalizado y una arquitectura escalable para acelerar la transferencia hacia y desde AWS. DataSync escala y maneja de forma automática todas las tareas implicadas en el movimiento de los datos, el control del progreso de las transferencias, el cifrado y la validación de las transferencias de datos y la notificación al cliente sobre cualquier falla. Con DataSync solo paga por la cantidad de datos copiados sin compromisos mínimos ni pagos iniciales.

P: ¿Desde y hacia dónde puedo transferir los datos?

R: DataSync puede copiar los datos entre los sistemas de almacenamiento local y Amazon S3 y Amazon EFS. DataSync admite el protocolo NFS para acceder al almacenamiento local.

Configuración

P: ¿Cómo comienzo a usar DataSync?

R: Puede transferir los datos usando DataSync con unos pocos clic en la consola de administración de AWS o mediante la interfaz de línea de comandos de AWS (CLI). Para comenzar, implemente un agente de DataSync en su entorno de TI, configure la ubicación de fuente y destino e inicie la copia.

P: ¿Cómo implemento un agente de DataSync?

R: Implemente un agente de DataSync al descargar OVA desde la consola de AWS y utilizarlo en su hipervisor ESXi VMware local. El agente debe implementarse en su entorno de TI para que pueda acceder a su servidor local de NFS.

P: ¿Cuáles son los requisitos de recurso del agente de DataSync?

R: Los recursos mínimos requeridos por agente se pueden consultar aquí.

Uso

P: ¿Cómo utilizo DataSync?

R: 1. Implemente un agente – Implemente un agente de DataSync local y asócielo con su cuenta de AWS mediante la consola de gestión o una API. El agente se usará para acceder a su NFS local desde la cual leer los datos o escribir para ellos. No hay necesidad de implementar agentes en EC2 o gestionar cualquier recurso en la nube.

2. Cree una tarea de transferencia de datos – Cree una tarea mediante la especificación de la ubicación del origen y el destino de los datos, y cualquier opción que desee usar para configurar la transferencia, como copiar metadatos de archivos.

3. Inicie la transferencia – Inicie la tarea y controle la migración de los datos en la consola o con Amazon CloudWatch.

P: ¿Cómo inicio una tarea de DataSync?

R: DataSync copia los datos cuando inicia una tarea mediante la consola de administración de AWS o CLI. Cada vez que ejecuta una tarea, escanea la fuente buscando cambios y realiza una copia de cualquier diferencia entre la fuente y el destino. Puede configurar qué características de la fuente se usan para determinar qué cambió y si los archivos u objetos en el destino deben eliminarse si no se encuentran en la fuente.  

P: ¿Cómo DataSync realiza la validación de la integridad de los datos?

R: DataSync realiza la verificación de la integridad de los datos tanto durante como al final de la transferencia (comparación de la suma de comprobación entre los archivos de fuente y destino, como así también, de los metadatos del archivo).

P: ¿Cómo puedo controlar el estado de los datos que DataSync está transfiriendo?

R: Puede usar la consola de administración de AWS o CLI para controlar el estado de los datos que se están transfiriendo. Al usar las Métricas de CloudWatch, puede ver la cantidad de archivos y de datos que se han copiado. Amazon CloudWatch logs están disponibles para información detallada del error. Además, los Eventos de CloudWatch se activan a medida que sus tareas cambian de estado, habilitando la automatización de los flujos de trabajo dependientes. Puede obtener información adicional, como el progreso de la transferencia, en la consola de administración de AWS o CLI.

P: ¿Cómo DataSync accede a mi sistema de archivo local?

R: DataSync usa los agentes que implementa en su entorno de TI para acceder a sus sistemas de archivo local mediante el protocolo de NFS. Estos agentes se conectan a AWS usando Internet o AWS Direct Connect y están seguramente administrados desde la consola de administración de AWS o CLI. No hay necesidad de configurar un VPN/túnel o habilitar conexiones entrantes y los agentes se pueden configurar para enrutarse mediante un firewall usando los puertos de red estándar.

P: ¿Cómo accede DataSync a mi bucket de Amazon S3?

R: DataSync accede a su bucket de Amazon S3 usando la función de IAM que usted configura.

P: ¿Cómo DataSync accede a mi sistema de archivo EFS de Amazon?

R: DataSync accede a sus sistema de archivos EFS de Amazon mediante el protocolo de NFS. Lo hace al organizar su sistema de archivo desde su VPC usando interfaces de red elásticas (ENI) que DataSync administra. DataSync administra completamente la creación, usa y borra estas ENI en su nombre.

P: Al transferir los archivos desde o hacia Amazon S3, ¿cómo DataSync mapea entre los archivos y los objetos?

R: Cuando los archivos se copian a los objetos, existe una relación de uno a uno entre un archivo y un objeto. Los metadatos del sistema de archivos se almacenan en los metadatos de usuario S3. Los metadatos se almacenan cuando los objetos que contienen los metadatos del sistema de archivos se copian de nuevo a los archivos.

P: ¿Qué metadatos preserva DataSync cuando transfiere los datos?

R: DataSync preserva los metadatos de POSIX como la id. de usuario, la id. de grupo y los permisos para asegurar que los archivos se puedan restaurar a su ubicación original sin perder datos de estos metadatos. Además, al almacenar los metadatos de POSIX desde los archivos para los objetos en S3, los metadatos son interoperables con File Gateway.

P: ¿Puedo usar el control de versiones, el ciclo de vida, la replicación entre regiones y la notificación de eventos de S3 con DataSync?

R: Sí. Sus políticas de administración de creación de versiones, ciclo de vida, replicación entre regiones y notificación de eventos de S3 se aplican directamente a los objetos transferidos a su bucket mediante DataSync.

Cuando usa las versiones, tenga en cuenta que los cambios a los metadatos de objeto crearán una nueva versión del objeto.

Puede usar las políticas de ciclo de vida de S3 para cambiar la capa de almacenamiento de un objeto o eliminar objetos o versiones de objetos antiguos.

P: ¿Se cifran mis datos a medida que se transfieren y almacenan?

R: Sí. Todos los datos transferidos entre la fuente y el destino se cifran mediante Transport Layer Security (TLS, que reemplazó a Secure Sockets Layer, SSL) Los datos nunca persisten en DataSync por sí mismos. El servicio admite el uso de cifrado predeterminado para los buckets de S3 y el cifrado de los datos en reposo del sistema de archivos de EFS de Amazon.

P: ¿Qué pasa si se interrumpe una tarea de DataSync

R: Si se interrumpe una tarea (por ejemplo, si la conexión de red falla o el agente de DataSync se reinicia), la siguiente ejecución de la tarea transferirá los archivos faltantes y los datos se completarán y serán consistentes al final de esta ejecución. Cada vez que se inicie una tarea, realiza una copia incremental que transfiere solo los cambios desde la fuente al destino.

P: ¿Puedo usar DataSync con AWS Direct Connect?

R: Sí. Puede usar DataSync con su enlace de Direct Connect para acceder a los puntos de enlace de Internet públicos sin ninguna configuración especial.

Rendimiento

P: ¿Cuán rápido DataSync copia mi sistema de archivo a AWS?

R: La tasa en la cual DataSync puede copiar un conjunto dado de datos es una función de la cantidad de datos, el ancho de banda de E/S archivable desde la fuente y el almacenamiento de destino, el ancho de banda de red disponible y las condiciones de red. Un solo agente de DataSync es capaz de saturar un enlace de red de 10 Gbps.

P: ¿Puedo controlar la cantidad de ancho de banda de red que usa una tarea de DataSync?

R: Sí, puede controlar la cantidad de ancho de banda de red que DataSync usará al configurar el acelerador de ancho de banda incorporado. Esto puede ayudar a minimizar el impacto en los demás usuarios o aplicaciones que confían en la misma conexión de red.

P: ¿DataSync afectará el rendimiento de mi sistema de archivos de fuente?

R: Según la capacidad de almacenamiento de archivos local y la cantidad y el tamaño de los archivos a transferir, DataSync puede afectar el tiempo de respuesta de los demás clientes cuando accedan al mismo almacenamiento de datos fuente debido a que el agente lee o escribe los datos desde el sistema de almacenamiento. Al configurar un límite de ancho de banda para una tarea reducirá este impacto al limitar la E/S frente a su sistema de almacenamiento.

Conformidad

P: ¿Qué programas de conformidad admite DataSync?

R: AWS tiene un programa de conformidad de la más duradera ejecución y está comprometido con ayudar a los clientes a que naveguen sus requisitos. DataSync se ha evaluado para cumplir con los estándares globales y de la industria en seguridad. Cumple con PCI DSS, ISO 9001, 27001, 27017 y 27018, además de ser elegible para HIPAA. Esto le facilita la verificación de nuestra seguridad y cumple con sus propias obligaciones. Si desea obtener más información y recursos, visite las páginas sobre temas de conformidad. También puede ir a los Servicios al alcance mediante la página del Programa de Cumplimiento para ver una lista completa de servicios y certificaciones.

P: ¿DataSync está en conformidad con PCI?

R: Sí. DataSync está en conformidad con PCI-DDS, lo que significa que puede usarlo para transferir información de pago. Puede descargar el Paquete de conformidad PCI en AWS Artifact para obtener más información sobre cómo alcanzar la conformidad PCI en AWS.

P: ¿DataSync es compatible con HIPAA?

R: Sí. DataSync es compatible con HIPAA, lo que significa que tiene un HIPAA BAA establecido con AWS, puede usar DataSync para transferir información protegida de salud (PHI).

Cuándo elegir AWS DataSync

P: ¿Cómo elijo entre los productos de AWS DataSync y AWS Snowball Edge?

R: AWS Snowball Edge es adecuado para los clientes que no necesitan sus datos en AWS inmediatamente, tienen restricciones de ancho de banda o transfieren los datos desde entornos remotos, desconectados o austeros. DataSync es ideal para los clientes que necesitan migraciones en línea para los conjuntos de datos activos, transferencias a tiempo para los datos generados continuamente o replicación para la continuidad empresarial.

P: ¿Cómo elijo entre los productos de AWS DataSync y AWS Storage Gateway?

R: AWS Storage Gateway ofrece capacidades de almacenamiento en la nube híbrida, conexión a las aplicaciones locales para los servicios de almacenamiento de AWS con acceso de baja latencia y se usa para el respaldo, la nivelación y el acceso local para los objetos almacenados en S3. DataSync se usa para copiar los datos rápidamente dentro o fuera de los servicios de almacenamiento de AWS. Puede usar DataSync para transferir rápido los datos existentes hacia Amazon S3 y la configuración de File Gateway de Storage Gateway para el acceso subsiguiente de baja latencia a esos datos desde las instalaciones.

 

P: ¿Cómo elijo entre AWS DataSync y S3 Transfer Acceleration?

R: Si sus aplicaciones ya se han integrado con la API de Amazon S3 y quiere un mayor desempeño para transferir grandes archivos a S3, puede usar S3 Transfer Acceleration. Use DataSync si quiere transferir los datos desde sus sistemas de almacenamiento existentes (por ejemplo, un almacenamiento conectado a la red), desde los instrumentos que no pueden cambiarse (por ejemplo, secuenciadores de ADN, cámaras de video) o si quiere múltiples destinos.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Más información acerca de los precios

AWS DataSync tiene precios simples, predecibles, con base en el uso y pasa solo por la cantidad de datos que copia.  

Más información 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Inscríbase para obtener una cuenta gratuita

Obtenga acceso automáticamente a la capa gratuita de AWS. 

Inscribirse 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Comience a migrar los datos en la consola

Comience a crear con AWS DataSync en la consola de AWS.

Iniciar sesión