Aspectos generales

P: ¿Qué es AWS DataSync?

R: AWS DataSync es un servicio de transferencia de datos en línea que simplifica, automatiza y acelera la copia de cantidades grandes de datos entre sistemas de almacenamiento en las instalaciones y servicios de AWS Storage, así como entre servicios de AWS Storage. DataSync puede copiar datos de Network File System (NFS), servidores de archivos Server Message Block (SMB), almacenamiento de objetos autoadministrado, AWS Snowcone, buckets de Amazon Simple Storage Service (Amazon S3), sistemas de archivos de Amazon Elastic File System (Amazon EFS) y sistemas de archivos de Amazon FSx for Windows File Server.

P: ¿Por qué debería utilizar AWS DataSync?

R: AWS DataSync le permite copiar grandes conjuntos de datos con miles de millones de archivos sin necesidad de crear soluciones personalizadas con herramientas de código abierto ni de otorgar licencias y administrar un software costoso de aceleración de red comercial. Con DataSync puede migrar datos activos hacia AWS, archivar datos para liberar espacio de almacenamiento en las instalaciones, replicar datos en AWS para la continuidad empresarial o transferir datos a la nube para realizar tareas de análisis y procesamiento.

P: ¿Qué problemas me resuelve AWS DataSync?

R: AWS DataSync reduce la complejidad y el costo de la transferencia de datos en línea. De este modo, se simplifica la transferencia de conjuntos de datos entre los sistemas de almacenamiento en las instalaciones y los servicios de AWS Storage y entre los servicios de AWS Storage. DataSync se conecta a los orígenes de datos y sistemas de almacenamiento existentes mediante protocolos de almacenamiento estándar (NFS o SMB) o a través de la API de Amazon S3. Usa un protocolo de red personalizado y arquitectura escalable para acelerar la transferencia de datos entre los sistemas de almacenamiento y el servicio de AWS. DataSync escala y maneja de forma automática todas las tareas implicadas en el movimiento de datos y objetos, el programa de transferencias de datos, el monitoreo del progreso de las transferencias, el cifrado, la verificación de las transferencias de datos y la notificación al cliente sobre cualquier falla. Con DataSync, solo paga por la cantidad de datos copiados, sin compromisos mínimos ni pagos iniciales.

P: ¿Desde y hacia dónde puedo transferir los datos?
R: AWS DataSync puede transferir datos de Network File System (NFS), servidores de archivos Server Message Block (SMB), almacenamiento de objetos autoadministrado, AWS Snowcone, buckets de Amazon Simple Storage Service (Amazon S3), sistemas de archivos de Amazon Elastic File System (Amazon EFS) y sistemas de archivos de Amazon FSx for Windows File Server.

P: ¿Cómo utilizo AWS DataSync para migrar datos a AWS?

R: Puede usar AWS DataSync para migrar datos en las instalaciones a Amazon S3, Amazon EFS y Amazon FSx for Windows File Server. Configure DataSync para realizar una copia inicial de todo el conjunto de datos, y programe transferencias incrementales posteriores de datos cambiantes hasta la transición final desde los datos en las instalaciones a AWS. DataSync incluye cifrado y validación de integridad para ayudarlo a garantizar que sus datos lleguen de manera segura, intacta y lista para usar. A fin de disminuir el impacto sobre las cargas de trabajo que utilizan su conexión de red, puede programar su migración para que se ejecute durante las horas no pico, o limitar el ancho de banda de la red que DataSync usa mediante la configuración del limitador de ancho de banda integrado. DataSync conserva los metadatos entre sistemas de almacenamiento que tienen estructuras de metadatos similares, lo que permite realizar una transición suave de usuarios finales y aplicaciones al usar su servicio de almacenamiento de AWS de destino. Lea la publicación del blog de almacenamiento, "Migración de almacenamiento con AWS DataSync" para obtener consejos y más información sobre las prácticas recomendadas de migración.

P: ¿Cómo utilizo AWS DataSync para archivar datos inactivos?

R: Puede usar AWS DataSync para transferir datos inactivos desde los sistemas de almacenamiento en las instalaciones directamente hasta ubicaciones de almacenamiento a largo plazo duraderas y seguras, como Amazon S3 Glacier o Amazon S3 Glacier Deep Archive. Use la funcionalidad de filtrado de DataSync para excluir del proceso de copiado carpetas y archivos temporales, copiar únicamente un subconjunto de archivos de la ubicación de origen o dividir un único sistema de archivos en varios destinos. Puede seleccionar el servicio de almacenamiento más rentable según sus necesidades: transferencia de datos a cualquier clase de almacenamiento de S3 o usar DataSync con la administración del ciclo de vida EFS para almacenar los datos en la clase de almacenamiento de acceso poco frecuente Amazon EFS (EFS IA). Use la funcionalidad para programación de tareas integrada si desea archivar periódicamente los datos que se deben retener con fines de conformidad o auditoría, como registros, imágenes de video sin procesar o registros médicos electrónicos. 

P: ¿Cómo utilizo AWS DataSync para replicar los datos en AWS a fin de garantizar la continuidad empresarial?

R: Con AWS DataSync, puede replicar archivos periódicamente en cualquier clase de almacenamiento de Amazon S3 o enviar los datos a Amazon EFS o Amazon FSx for Windows File Server para contar con un sistema de archivos en espera. Use la funcionalidad para programación de tareas integrada a fin de garantizar que los cambios en el conjunto de datos se copien periódicamente en el almacenamiento de destino. Lea esta publicación del blog sobre AWS Storage para obtener más información acerca de cómo proteger los datos con AWS DataSync.

P: ¿Cómo utilizo AWS DataSync para transferencias recurrentes entre el almacenamiento en las instalaciones y AWS para flujos de trabajo continuos?

R: Puede usar AWS DataSync para las transferencias continuas desde los sistemas en las instalaciones hacia dentro o fuera de AWS para el procesamiento. DataSync permite acelerar los flujos de trabajo de almacenamiento híbrido y crítico en la nube en sectores que necesitan transferir archivos a AWS rápidamente. Eso incluye aprendizaje automático en ciencias biológicas, creación de videos con contenido multimedia y de entretenimiento, análisis de big data en servicios financieros e investigación sísmica en el área de petróleo y gas. DataSync ofrece una entrega oportuna para garantizar que los procesos dependientes no se demoren. Puede especificar un filtro de exclusión, un filtro de inclusión, o ambos, para determinar qué archivos, carpetas u objetos deben transferirse cada vez que se ejecute una tarea.

P: ¿Puedo usar AWS DataSync para crear un lago de datos propio?

R: Sí. Con AWS DataSync, puede crear fácilmente su lago de datos mediante la automatización de la transferencia de conjuntos de datos en las instalaciones a Amazon S3. DataSync permite hacer una transferencia simple y rápida de su conjunto de datos completo mediante el uso de protocolos de almacenamiento estándar (NFS o SMB) o la API de Amazon S3. Después de transferir el conjunto de datos inicial, puede programar transferencias posteriores de datos nuevos de las instalaciones a AWS. DataSync incluye cifrado y validación de integridad para ayudarlo a garantizar que sus datos lleguen de manera segura, intacta y lista para usar. A fin de disminuir el impacto sobre las cargas de trabajo que utilizan su conexión de red, puede programar las tareas de transferencia para que se ejecuten durante las horas de menor demanda, o limitar el ancho de banda de la red que DataSync usa mediante la configuración del limitador de ancho de banda integrado. Cuando los datos estén depositados en Amazon S3, podrá usar servicios de AWS nativos para ejecutar aplicaciones de análisis de big data, inteligencia artificial (IA), aprendizaje automático, informática de alto rendimiento y procesamiento de datos multimedia para obtener información a partir de conjuntos de datos no estructurados. Consulte la página web sobre almacenamiento en lagos de datos de AWS para obtener más información sobre la creación y cómo sacarle partido a su lago de datos.

P: ¿Cómo uso AWS DataSync para transferir datos entre los servicios de AWS Storage?

R: Puede usar DataSync para transferir archivos u objetos entre Amazon S3, Amazon EFS o Amazon FSx for Windows File Server en la misma cuenta de AWS. Puede transferir datos entre los servicios de AWS en la misma región de AWS, entre los servicios en regiones comerciales diferentes de AWS en China o entre regiones de AWS GovCloud (Este y Oeste de EE. UU.). Esto no requiere implementar un agente de DataSync y se puede configurar de extremo a extremo mediante la consola de AWS DataSync, la interfaz de línea de comandos (CLI) o el kit de desarrollo de software (SDK) de AWS.

P: ¿Puedo usar AWS DataSync para migrar a Amazon WorkDocs?

R: Sí. AWS DataSync acelera un paso necesario para el servicio de migración de Amazon WorkDocs mediante la automatización de la carga de archivos al bucket de Amazon S3 que se usa para la migración. DataSync facilita y agiliza la migración de directorios principales y archivos compartidos de departamentos a WorkDocs. Para obtener más información acerca de cómo usar DataSync para migrar a WorkDocs, lea la publicación de blog “Migrating network file shares to Amazon WorkDocs using AWS DataSync”.

Uso

P: ¿Cómo puedo comenzar a utilizar AWS DataSync?

R: Puede transferir los datos mediante AWS DataSync con unos pocos clics en la consola de administración de AWS o mediante la interfaz de línea de comandos (CLI) de AWS. Para comenzar, siga estos tres pasos:

1. Para transferir datos entre los sistemas de almacenamiento en las instalaciones y los servicios de AWS Storage, implemente un agente de DataSync y asócielo a la cuenta de AWS con la consola de administración o la API. El agente se usará para obtener acceso a su servidor NFS, a sus archivos compartidos de SMB o a su almacenamiento de objetos autoadministrado para leer sus datos o escribir en ellos. No es necesario implementar un agente para transferir datos entre los servicios de AWS Storage en la misma cuenta de AWS.

2. Cree una tarea de transferencia de datos: cree una tarea mediante la especificación de la ubicación del origen y el destino de los datos, y cualquier opción que desee usar para configurar la transferencia, como la programación deseada de las tareas.

3. Inicie la transferencia: inicie la tarea y monitoree la migración de los datos en la consola o con Amazon CloudWatch.

P: ¿Cómo implemento un agente de AWS DataSync?

R: Debe implementar un agente de AWS DataSync en el hipervisor en las instalaciones o en Amazon EC2. Para copiar datos en un servidor de archivos en las instalaciones o desde este, descargue la imagen de máquina virtual del agente en la consola de AWS e implementarla en su hipervisor VMware ESXi en las instalaciones, Virtual Machine basado en Linux Kernel (KVM) o Microsoft Hyper-V. Cuando se usa un agente de DataSync, debe implementarse ese agente para que pueda acceder al servidor de archivos por medio del protocolo NFS o SMB, o a través de la API de Amazon S3. Para configurar las transferencias entre los buckets de S3 en AWS Outposts y los de las regiones de AWS, implemente el agente en el Outpost. Para configurar transferencias entre el dispositivo AWS Snowcone y un servicio de almacenamiento de AWS, use la AMI del agente de DataSync que ya viene instalada en el dispositivo.

No es necesario implementar un agente para transferir datos entre los servicios de AWS Storage en la misma cuenta de AWS. Para copiar datos de un servidor de archivos autoadministrados en la nube o en él, o entre los servicios de AWS Storage en diferentes cuentas de AWS, lance una instancia de Amazon EC2 con una AMI del agente de DataSync.

P: ¿Cuáles son los recursos necesarios para ejecutar el agente de AWS DataSync?

R: Los recursos mínimos que necesita para ejecutar el agente se pueden consultar aquí.

P: ¿Cómo inicio una tarea de transferencia de datos de AWS DataSync?

R: AWS DataSync copia los datos cuando se inicia una tarea mediante la consola de administración de AWS o la interfaz de línea de comandos (CLI) de AWS. Cada vez que se ejecuta una tarea, se escanea el origen y el destino en busca de cambios y se realiza una copia de cualquier diferencia entre los datos y los metadatos del origen y el destino. Puede configurar qué características del origen se usarán para determinar las diferencias, definir filtros para incluir y excluir archivos o carpetas específicos y controlar si los archivos u objetos en el destino deben sobrescribirse cuando se cambian en el origen o eliminarse cuando no se encuentran en el origen.

P: ¿Cómo se asegura AWS DataSync de que mis archivos se hayan copiado correctamente?

R: Como AWS DataSync transfiere y almacena datos, realiza controles de integridad para garantizar que los datos escritos en el destino coincidan con los datos leídos en el origen. Además, se puede realización un control de verificación opcional para comparar el origen y el destino una vez finalizada la transferencia. DataSync calculará y comparará las sumas de comprobación de todos los archivos de los datos almacenados en el origen y en el destino. Puede verificar todo el conjunto de datos o solo los archivos u objetos que DataSync transfirió.

P: ¿Cómo puedo controlar el estado de los datos que AWS DataSync está transfiriendo?

R: Puede usar la consola de administración de AWS o la CLI para controlar el estado de los datos que se están transfiriendo. Con las métricas de Amazon CloudWatch, puede ver la cantidad de archivos y de datos que se ha copiado. También puede activar el registro de archivos individuales en CloudWatch Logs para identificar las transferencias que se han producido en un momento específico, además de los resultados de verificación de integridad del contenido que realiza DataSync. De este modo, se simplifican las labores de monitoreo, generación de informes y solución de problemas, y puede ofrecer actualizaciones rápidas a los interesados. Puede obtener información adicional, como el avance de la transferencia, en la consola de administración de AWS o la CLI.

P: ¿Puedo filtrar los archivos y las carpetas que transfiere AWS DataSync?

R: Sí. Puede especificar un filtro de exclusión, un filtro de inclusión, o ambos, para limitar qué archivos, carpetas u objetos deben transferirse cada vez que se ejecute una tarea. En el momento que se crea una tarea, puede configurar las rutas de archivos o las claves de objetos que jamás deben copiarse. A continuación, cuando inicie una tarea, puede configurar las rutas de archivos o las claves de objetos que deben incluirse para dicha ejecución de la tarea. Si no se configura ningún filtro, cada vez que se ejecute una tarea, esta transferirá todos los cambios desde el origen al destino. Consulte este blog sobre almacenamiento AWS para informarse más sobre el uso de filtros comunes con DataSync.

P: ¿Puedo configurar AWS DataSync para transferir según un programa?

R: Sí. Puede organizar sus tareas con la consola AWS DataSync o la interfaz de línea de comandos (CLI) AWS, sin necesidad de escribir ni ejecutar scripts para administrar las transferencias repetidas. La organización de las tareas ejecuta, de manera automática, las tareas según el programa que configuró, con opciones cada hora, por día o semanales, que se indican directamente en la consola. Esto le permite garantizar que los cambios en el conjunto de datos se detectan y copian automáticamente en el almacenamiento de destino.

P: ¿AWS DataSync conserva la estructura del directorio cuando copia archivos?

R: Sí. Cuando transfiere archivos, AWS DataSync crea la misma estructura de directorio en el destino que en la ubicación de origen.

P: ¿Qué sucede si se interrumpe una tarea de AWS DataSync?

R: Si se interrumpe una tarea (por ejemplo, si la conexión de red falla o el agente de AWS DataSync se reinicia) la siguiente ejecución de la tarea transferirá los archivos faltantes y los datos estarán completos y serán congruentes al finalizar la ejecución. Cada vez que se inicia una tarea, se realiza una copia gradual y se transfieren únicamente los cambios desde el origen al destino.

P: ¿Puedo usar AWS DataSync con AWS Direct Connect?

R: Sí. Puede utilizar AWS DataSync con su enlace de Direct Connect para obtener acceso a los puntos de enlace de los servicios públicos o los puntos de enlace de la VPC privados. Con los puntos de enlace de la VPC, los datos transferidos entre el agente de DataSync y los servicios de AWS no atraviesan la Internet pública ni necesitan direcciones IP públicas, lo que aumenta la seguridad de los datos a medida que se copian a través de la red.

P: ¿AWS DataSync admite los puntos de enlace de la VPC o de AWS PrivateLink?

R: Sí. Puede utilizar los puntos de enlace de la VPC para garantizar que la transferencia de datos con su agente de AWS DataSync, implementado de forma local o en la nube, no atraviese redes públicas de Internet ni requiera el uso de direcciones de IP públicas. El uso de los puntos de enlace de la VPC aumenta la seguridad de sus datos ya que mantiene el tráfico de la red dentro de su Amazon Virtual Private Cloud (Amazon VPC). Los puntos de enlace de la VPC para DataSync funcionan con AWS PrivateLink, una tecnología escalable de alta disponibilidad que le permite conectar de forma privada su VPC a los servicios de AWS compatibles.

P: ¿Cómo configuro AWS DataSync para poder utilizar los puntos de enlace de la VPC?

R: Para poder utilizar los puntos de enlace de la VPC con AWS DataSync, debe crear un punto de enlace de la VPC de interfaz AWS PrivateLink para el servicio DataSync en la VPC de su elección y, a continuación, elegir esta interfaz de red elástica (ENI) de punto de enlace al momento de crear el agente de DataSync. El agente se conectará con esta ENI para activarse y, posteriormente, todos los datos transferidos por el agente permanecerán dentro de la VPC que configuró. Puede utilizar la consola de AWS DataSync, la interfaz de línea de comandos de AWS (CLI) o AWS SDK para configurar los puntos de enlace de la VPC. Para obtener más información, consulte Utilizar AWS DataSync en una nube virtual privada.

Transferencias desde y hacia Amazon S3

P: ¿Puedo copiar mis datos en Amazon S3 Glacier, Amazon S3 Glacier Deep Archive u otras clases de almacenamiento S3?

R: Sí. Durante la configuración de un bucket S3 para usar con AWS DataSync, puede seleccionar la clase de almacenamiento S3 que DataSync usa para almacenar objetos. DataSync admite el almacenamiento de datos directamente en S3 Estándar, S3 Intelligent Tiering, S3 Estándar - Almacenamiento de acceso poco frecuente (S3 Standard-IA), S3 Única zona – Acceso poco frecuente (S3 One Zone-IA), Amazon S3 Glacier (S3 Glacier) y Amazon S3 Glacier Deep Archive (S3 Glacier Deep Archive). Puede encontrar más información sobre los Tipos de almacenamiento de Amazon S3 en la Guía para desarrolladores de Amazon Simple Storage Service.

Los objetos más pequeños que la capacidad de carga mínima por objeto se almacenarán en S3 Estándar. Por ejemplo, los objetos de carpeta, que tienen un tamaño de cero bytes y contienen solo metadatos, se almacenarán en S3 Estándar. Lea sobre consideraciones al trabajar con los tipos de almacenamiento de Amazon S3 en nuestra documentación. Para obtener más información sobre las capacidades de carga mínima, consulte Precios de Amazon S3.

P: ¿Puedo copiar los datos de las clases de almacenamiento Estándar - Acceso poco frecuente de S3 y Única zona - Acceso poco frecuente de S3?

R: Sí. Al usar S3 como la ubicación de origen para una tarea AWS DataSync, el servicio recuperará todos los objetos del bucket que deben copiarse en el destino. La recuperación de objetos del almacenamiento Estándar - Acceso poco frecuente de S3 y Única zona - Acceso poco frecuente de S3 generará una tarifa de recuperación basada en el tamaño de los objetos. Lea sobre las consideraciones al trabajar con los tipos de almacenamiento de Amazon S3 en nuestra documentación.

P: ¿Puedo copiar datos de S3 Glacier y Amazon S3 Glacier Deep Archive?

R: Al usar S3 como la ubicación de origen para una tarea de AWS DataSync, el servicio intentará recuperar todos los objetos del bucket que deben copiarse en el destino. La recuperación de objetos archivados en la clase de almacenamiento S3 Glacier o S3 Glacier Deep Archive produce un error. DataSync registrará cualquier error al recuperar objetos archivados y dará como resultado un estado de finalización de tarea fallido. Lea sobre las consideraciones al trabajar con los tipos de almacenamiento de Amazon S3 en nuestra documentación.

P: ¿Cómo obtiene acceso AWS DataSync a mi bucket de Amazon S3?

R: AWS DataSync asume un rol de IAM que usted proporciona. La política que adjunte al rol determina qué acciones puede realizar el rol. DataSync puede generar automáticamente este rol en su nombre o puede configurarlo manualmente.

P: ¿Cómo hace AWS DataSync para convertir archivos y carpetas desde o hacia objetos en Amazon S3?

R: Cuando los archivos o las carpetas se copian a Amazon S3, existe una relación de uno a uno entre un archivo o una carpeta y un objeto. Las marcas de tiempo de los archivos y las carpetas y los permisos POSIX, que incluyen ID de usuarios, ID de grupos y permisos, se almacenan en los metadatos de los usuarios de S3. Para compartir con NFS, los metadatos de archivos almacenados en los metadatos de usuario en S3 son totalmente interoperables con el gateway de archivos, lo que permite que AWS DataSync ofrezca acceso en las instalaciones basado en archivos a los datos almacenados en Amazon S3.

Cuando DataSync vuelve a copiar objetos que contienen los metadatos de este usuario en el servidor NFS, los metadatos del archivo se restauran. También se restauran los enlaces simbólicos y duros cuando se copian desde NFS a S3.

Cuando se realiza una copia desde un archivo compartido de SMB, los permisos POSIX predeterminados se almacenan en los metadatos del usuario de S3. Cuando se vuelve a realizar una copia en un archivo compartido de SMB, el propietario se establece según el usuario que estaba habilitado para acceder a ese archivo compartido en DataSync y se le asignan permisos predeterminados.

Obtenga más información sobre cómo DataSync almacena archivos y metadatos en nuestra documentación.

P: ¿Qué metadatos de objetos se conservan al transferir objetos entre el almacenamiento de objetos autoadministrado y Amazon S3?

R: Cuando se transfieren objetos entre el almacenamiento de datos autoadministrado y Amazon S3, DataSync copia los objetos junto con las etiquetas y los metadatos del objeto.

P: ¿Qué metadatos de los objetos se preservan cuando se transfieren objetos entre los buckets de Amazon S3?

R: Cuando se transfieren objetos entre los buckets de Amazon S3, DataSync copia los objetos junto con las etiquetas y los metadatos del objeto. DataSync no copia otra información de los objetos, como su ACL o sus versiones anteriores.

P: ¿Qué costos de solicitud y almacenamiento de Amazon S3 se aplican cuando se usan los tipos de almacenamiento de S3 con AWS DataSync?

R: Algunas clases de almacenamiento de S3 tienen comportamientos que pueden afectar su costo, como la recuperación de datos, las capacidades mínimas de almacenamiento y las duraciones mínimas de almacenamiento. DataSync automatiza la gestión de datos para abordar estos factores y proporciona configuraciones para minimizar la recuperación de datos.

A fin de evitar la carga por objeto de capacidad mínima, AWS DataSync automáticamente almacena los objetos pequeños en S3 estándar. A fin de disminuir las tarifas de recuperación de datos, puede configurar DataSync de manera que solamente valide los archivos que transfirió una tarea determinada. A fin de evitar los cargos mínimos por duración de almacenamiento, DataSync posee controles para la sobrescritura y eliminación de objetos. Lea sobre las consideraciones al trabajar con los tipos de almacenamiento de Amazon S3 en nuestra documentación.

P: ¿Puedo copiar datos de objetos desde y hacia los buckets de Amazon S3 en AWS Outposts?

R: Sí. Puede copiar objetos entre Amazon S3 en AWS Outposts y buckets de Amazon S3 en las regiones de AWS. AWS DataSync copia objetos junto con los metadatos y las etiquetas del objeto. Para que DataSync acceda a su Amazon S3 en los buckets de Outposts, implemente un agente de DataSync EC2 en su Outpost.

Al usar DataSync con Amazon S3 en Outposts, solo puede transferir datos hacia y desde buckets de Amazon S3 en las regiones de AWS. Puede obtener más información sobre las fuentes y destinos admitidos para las tareas de DataSync en nuestra documentación.

Transferencias desde y hacia Amazon EFS

P: ¿Cómo obtiene acceso AWS DataSync a mi sistema de archivos Amazon EFS?

R: AWS DataSync obtiene acceso a su sistema de archivos Amazon EFS mediante el protocolo NFS. El servicio de DataSync organiza su sistema de archivos desde su VPC desde interfaces de red elásticas (ENI) que administra el servicio DataSync. DataSync se encarga de administrar por completo la creación, el uso y la eliminación de estas ENI por usted.

P: ¿Puedo usar AWS DataSync con todos los tipos de almacenamiento de Amazon EFS?

R: Sí. Puede usar AWS DataSync a fin de copiar archivos en Amazon EFS y configurar la administración del ciclo de vida de EFS para migrar los archivos a los que no se accedió durante un periodo determinado al tipo de almacenamiento de acceso poco frecuente (IA).

P: ¿Puedo usar AWS DataSync para replicar el sistema de archivos de Amazon EFS en una región diferente de AWS?

R: Sí. Puede usar AWS DataSync para programar replicaciones periódicas del sistema de archivos de Amazon EFS en otro sistema de archivos de Amazon EFS en la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

P: ¿Qué metadatos se preservan cuando se copian datos entre el recurso compartido de NFS y Amazon EFS o entre dos sistemas de archivos de Amazon EFS?

R: AWS DataSync copia las marcas de tiempo de los archivos y las carpetas y los permisos POSIX, que incluyen ID de usuarios, ID de grupos y permisos. Puede obtener más información y ver la lista completa de metadatos copiados en nuestra documentación.

Transferencias desde y hacia Amazon FSx for Windows File Server

P: ¿Cómo AWS DataSync obtiene acceso a mi sistema de archivos de Amazon FSx?

R: AWS DataSync tiene acceso a su sistema de archivos de Amazon FSx con el protocolo SMB, mediante la autenticación con el nombre de usuario y contraseña que configure en la CLI o en la consola de AWS. El servicio de DataSync organiza su sistema de archivos desde su VPC desde interfaces de red elásticas (ENI) que administra el servicio DataSync. DataSync se encarga de administrar por completo la creación, el uso y la eliminación de estas ENI por usted.

P: ¿Qué metadatos de Windows se transfieren cuando se hacen copias de un recurso compartido de SMB al sistema de archivos de Amazon FSx for Windows File Server o entre dos sistemas de archivos de Amazon FSx?

R: AWS DataSync copia los metadatos de Windows, incluidas las marcas de tiempo del archivo, el propietario del archivo, los atributos de archivo estándar y las listas de acceso discrecional (DACL) de NTFS. Puede obtener más información y ver la lista completa de metadatos copiados en nuestra documentación.

P: ¿Puedo usar AWS DataSync para replicar el sistema de archivos de Amazon FSx for Windows File Server en otra región de AWS?

R: Sí. Puede usar AWS DataSync para programar replicaciones periódicas del sistema de archivos de Amazon FSx for Windows File Server en otro sistema de archivos en la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

Transferencias desde y hacia AWS Snowcone

P: ¿Cómo transfiero datos entre AWS Snowcone y los servicios de almacenamiento de AWS?

R: El agente de DataSync viene preinstalado en su dispositivo Snowcone como una AMI. Para transferir datos en línea a AWS, conecte el dispositivo AWS Snowcone a la red externa y use AWS OpsHub o la CLI para lanzar la AMI del agente de DataSync. Active el agente con la consola de administración de AWS o la CLI, y configure la tarea de transferencia de datos en línea entre el almacén NFS de AWS Snowcone y Amazon S3, Amazon EFS o Amazon FSx for Windows File Server.

Rendimiento

P: ¿Con qué velocidad AWS DataSync copia mi sistema de archivos a AWS?

R: La velocidad con la cual AWS DataSync puede copiar un conjunto de datos determinado depende de la cantidad de datos, del ancho de banda de E/S que se pueda alcanzar desde el origen y el almacenamiento de destino, del ancho de banda de red disponible y de las condiciones de la red. Para transferir archivos entre servicios en las instalaciones y de AWS Storage, una sola tarea de DataSync puede usar todo un enlace de red de 10 Gbps.

P: ¿Puedo controlar la cantidad de ancho de banda de red que puede usar una tarea de AWS DataSync?

R: Sí. Puede controlar la cantidad de ancho de banda de red que AWS DataSync usará. Para ello, configure el acelerador de ancho de banda integrado. Puede aumentar o reducir este límite mientras la tarea de transferencia de datos se esté ejecutando. Esto le permite minimizar el impacto en los demás usuarios o aplicaciones que utilizan la misma conexión de red.

P: ¿Cómo puedo monitorear el rendimiento de AWS DataSync?

R: AWS DataSync genera métricas de Amazon CloudWatch para ofrecer visibilidad granular en el proceso de transferencia. Mediante estas métricas, puede ver la cantidad de archivos y de datos que se han copiado, además de la detección de archivos y el progreso de validación. En la consola de DataSync se muestran directametne gráficos de CloudWatch con estas métricas.

P: ¿AWS DataSync afectará el rendimiento de mi sistema de archivos de origen?

R: Según la capacidad del almacén de archivos local y la cantidad y el tamaño de los archivos a transferir, AWS DataSync podría afectar el tiempo de respuesta de los demás clientes cuando obtengan acceso al mismo almacén de datos de origen debido a que el agente lee o escribe los datos desde dicho sistema de almacenamiento. Configurar un límite de ancho de banda para una tarea reducirá este impacto al restringir las operaciones de E/S que se realizarán en su sistema de almacenamiento.

Seguridad y conformidad

P: ¿Se cifran mis datos a medida que se transfieren y almacenan?

R: Sí. Todos los datos transferidos entre el origen y el destino se cifran mediante Transport Layer Security (TLS, que reemplazó a Capa de conexión segura, SSL) Los datos nunca persisten por sí mismos en AWS DataSync. El servicio admite el uso del cifrado predeterminado para buckets de S3, el cifrado de los datos en reposo del sistema de archivos de Amazon EFS y el cifrado en reposo y en tránsito de Amazon FSx for Windows File Server.

P: ¿Cómo accede AWS DataSync a mi servidor NFS o a mis archivos compartidos de SMB?

R: AWS DataSync usa un agente que usted implementa en su entorno de TI o en Amazon EC2 para obtener acceso a sus archivos mediante el protocolo NFS o el protocolo SMB. Este agente se conecta con los puntos de enlace del servicio DataSync dentro de AWS y se administran de manera segura a partir de la consola de administración de AWS o la CLI.

P: ¿Cómo accede AWS DataSync a mi almacenamiento de objetos autoadministrado?

R: AWS DataSync usa un agente que usted implementa en su entorno de TI o en Amazon EC2 para obtener acceso a sus archivos mediante la API de Amazon S3. Este agente se conecta con los puntos de enlace del servicio DataSync dentro de AWS y se administran de manera segura a partir de la consola de administración de AWS o la CLI.

P: ¿Requiere AWS DataSync la configuración de una VPN para conectarse a mi almacenamiento de destino?

R: No. Cuando se copian datos desde o hacia sus instalaciones, no es necesario configurar una VPN o un túnel, ni permitir las conexiones de entrada. Su agente de AWS DataSync puede configurarse para enrutarse a través de un firewall que usa puertos de red estándar. Puede implementar DataSync en su Amazon Virtual Private Cloud (Amazon VPC) mediante los puntos de enlace de la VPC. Con los puntos de enlace de la VPC, los datos transferidos entre el agente de DataSync y los servicios de AWS no atraviesan la Internet pública ni las direcciones IP públicas.

P: ¿Cómo se conectan de manera segura los agentes de AWS DataSync con AWS?

R: Los agentes de AWS DataSync se conectan con los puntos de enlace del servicio dentro de la región de AWS elegida. Cuando crea un agente, puede elegir que este se conecte con los puntos de enlace disponibles para Internet pública, los puntos de enlace validados según los Estándares de procesamiento de la información federal (FIPS) o los puntos de enlace dentro de una de sus VPC. La activación de su agente lo asocia de manera segura con su cuenta AWS. Para obtener más información, consulte Elegir un punto de enlace del servicio y Activar su agente.

P: ¿Cómo se repara y actualiza mi agente de AWS DataSync?

R: Una vez que se activa el agente, AWS aplica automáticamente las actualizaciones de la VM del agente, incluidos el sistema operativo subyacente y los paquetes de software de AWS DataSync. Las actualizaciones se aplican sin interrupciones cuando el agente está inactivo y no está ejecutando una tarea de transferencia de datos.

P: ¿A qué programas de conformidad adhiere AWS DataSync?

R: AWS posee el programa de conformidad de mayor duración en la nube. AWS está comprometida con ayudar a los clientes con sus requisitos. AWS DataSync ha sido evaluado para verificar el cumplimiento de estándares de seguridad globales y del sector. DataSync cumple con los requisitos de PCI DSS, ISO 9001, 27001, 27017 y 27018,SOC 1, 2 y 3, y de la leyHIPAA. DataSync también está autorizado en las regiones EE.UU. Este y Oeste de AWS bajo FedRAMP Moderate y en AWS GovCloud (EE.UU.) bajo FedRamp High. Esto le facilita la verificación de nuestra seguridad y el cumplimiento de sus propias obligaciones. Si desea obtener más información y recursos, visite las páginas sobre temas de conformidad. También puede ir a la página Servicios de AWS en el ámbito del programa de conformidad para ver una lista completa de servicios y certificaciones.

P: ¿AWS DataSync cumple los requisitos normativos de PCI?

R: Sí. AWS DataSync cumple con PCI-DSS, lo que significa que puede usarlo para transferir información de pago. Puede descargar el Paquete de conformidad con PCI en AWS Artifact para obtener más información sobre cómo lograr la conformidad con PCI en AWS.

P: ¿AWS DataSync es compatible con HIPAA?

R: Sí. AWS DataSync es compatible con HIPAA, lo que significa que si tiene un HIPAA BAA establecido con AWS, puede usar DataSync para transferir información protegida de salud (PHI).

P: ¿AWS DataSync tiene autorización provisional moderada de FedRAMP JAB en las regiones Este y Oeste de EE. UU. de AWS?

R: Sí. AWS DataSync recibió una autorización provisional para operar (P-ATO) por parte del Consejo Conjunto de Autorización (JAB) en el Programa Federal de Administración de Autorizaciones y Riesgos (FedRAMP) de referencia moderada en las regiones del Este y Oeste de EE. UU. Si es un cliente federal o comercial, puede usar AWS DataSync en los límites de autorización de las regiones Este y Oeste de AWS con datos hasta un nivel de impacto moderado.

P: ¿AWS DataSync tiene autorización provisional alta de FedRAMP JAB en las regiones AWS GovCloud (EE. UU.)?

R: Sí. AWS DataSync recibió una autorización provisional para operar (P-ATO) por parte del Consejo Conjunto de Autorización (JAB) en el Programa Federal de Administración de Autorizaciones y Riesgos (FedRAMP) de referencia alta en la región GovCloud de EE. UU. Si es un cliente federal o comercial, puede usar AWS DataSync en los límites de autorización de la región AWS GovCloud (EE. UU.) con datos hasta un nivel de impacto alto.

Cuándo elegir AWS DataSync

P: ¿Qué diferencias existen entre AWS DataSync y el uso de herramientas de línea de comandos como rsync o la interfaz de línea de comando de Amazon S3?

R: AWS DataSync acelera y automatiza por completo la transferencia de conjuntos de datos grandes a AWS. Presenta integración nativa con Amazon S3, Amazon EFS, Amazon FSx for Windows File Server, Amazon CloudWatch y AWS CloudTrail, lo que ofrece un acceso seguro y optimizado a sus servicios de almacenamiento, además de monitoreo detallado de la transferencia.

DataSync utiliza una arquitectura de escala ajustable y un protocolo de red personalizado para transferir datos. Para transferir archivos entre servicios en las instalaciones y de AWS Storage, una sola tarea de DataSync puede usar todo un enlace de red de 10 Gbps.

DataSync automatiza por completo la transferencia de datos. Incluye mecanismos de resiliencia de red y repetición de intentos, optimizaciones de red, programación de tareas integrada, monitoreo a través de la consola y la API de DataSync, y registros, eventos y métricas de CloudWatch que ofrecen una visibilidad detallada sobre el proceso de transferencia. DataSync realiza una verificación de la integridad de los datos tanto durante la transferencia como al momento de su finalización.

DataSync ofrece seguridad total y se integra directamente con los servicios de almacenamiento de AWS. Todos los datos transferidos entre el origen y el destino se cifran con TLS y el acceso a su almacenamiento de AWS se activa mediante mecanismos de seguridad de AWS integrados, como roles de IAM. Data Sync con los puntos de enlace de la VPC están activados para garantizar que los datos transferidos entre una organización y AWS no atraviesan la Internet pública, lo que aumenta la seguridad de los datos a medida que se copian a través de la red.

P: Para transferir objetos entre los buckets, ¿cuándo debo usar AWS DataSync, cuándo debo usar la replicación de S3 y cuándo las operaciones por lote de S3?

R: AWS ofrece varias herramientas para copiar objetos entre los buckets.

Use AWS DataSync para la distribución continua, las canalizaciones y la incorporación de lagos de datos y también para consolidar o separar los datos en varios buckets.

Use la replicación de S3 a fin de replicar de forma continua los datos en un bucket de destino específico.

Use las operaciones por lote de S3 a fin de operar con lotes a gran escala en los objetos de S3, como para copiar objetos, definir etiquetas o listas de control de acceso (ACL) de los objetos, iniciar restauraciones de objetos de Amazon S3 Glacier, invocar una función de AWS Lambda a fin de realizar acciones personalizadas con los objetos, administrar la retención legal del bloqueo de objetos de S3 y las fechas de dicha retención.

P: ¿Cuándo uso AWS DataSync y cuándo AWS Snowball Edge?

R: AWS DataSync es perfecto para transferencias de datos en línea. DataSync puede migrar datos activos hacia AWS, transferir datos a la nube a fin de realizar tareas de análisis, archivar datos para liberar espacio de almacenamiento en las instalaciones o replicar datos en AWS para la continuidad empresarial.

AWS Snowball Edge es perfecto para transferencias de datos sin conexión para clientes que tienen restricciones de ancho de banda o que transfieren los datos desde entornos remotos, sin conexión a Internet o limitados. 

P: ¿Cuándo uso AWS DataSync y cuándo AWS Storage Gateway?

R: Use AWS DataSync para migrar los datos existentes a Amazon S3 y luego use la configuración de File Gateway de AWS Storage Gateway a fin de retener el acceso a los datos migrados y de aplicar actualizaciones continuas de las aplicaciones basadas en archivos en las instalaciones.

Puede usar una combinación de DataSync y File Gateway para disminuir la infraestructura en las instalaciones al mismo tiempo que conecta de forma sencilla las aplicaciones locales. AWS DataSync le permite automatizar y acelerar las transferencias de datos en línea a los servicios de AWS Storage. Luego de la fase inicial de transferencia de datos mediante AWS DataSync, File Gateway le ofrece a las aplicaciones en las instalaciones acceso de latencia baja a los datos migrados. Cuando DataSync se usa con recursos compartidos de NFS, se preservan los metadatos POSIX del almacenamiento en las instalaciones de origen y los permisos del almacenamiento de origen se aplican cuando se accede a los datos a través de File Gateway.

P: ¿Cuándo uso AWS DataSync y cuándo uso Amazon S3 Transfer Acceleration?

R: Si sus aplicaciones ya se han integrado con la API de Amazon S3 y usted desea un mayor rendimiento para transferir grandes archivos a S3, puede usar S3 Transfer Acceleration. Use AWS DataSync si quiere transferir los datos desde sus sistemas de almacenamiento existentes (por ejemplo, un almacenamiento dependiente de la red), desde los instrumentos que no pueden cambiarse (por ejemplo, secuenciadores de ADN, cámaras de video) o si desea usar varios destinos. DataSync también automatiza y simplifica la transferencia de datos mediante el suministro de funcionalidades adicionales, como los mecanismos integrados de resiliencia de red y repetición de intentos, la verificación de la integridad de los datos y la configuración flexible para adaptarse a sus necesidades específicas, incluida la limitación controlada del ancho de banda.

P: ¿Cuándo uso AWS DataSync y cuándo AWS Transfer Family?

R: Si actualmente usa SFTP para intercambiar datos con terceros, AWS Transfer Family le ofrece una transferencia SFTP, FTPS y FTP completamente administrada y directa hacia y desde Amazon S3, mientras que reduce la carga operativa.

Si desea realizar una transferencia de datos automatizada y agilizada entre servidores NFS, archivos compartidos de SMB, el almacenamiento de objetos autoadministrado, AWS Snowcone, Amazon S3, Amazon EFS y Amazon FSx for Windows File Server, puede usar AWS DataSync. DataSync es ideal para los clientes que necesitan realizar migraciones en línea de conjuntos de datos activos, transferencias a tiempo de datos que se generan de manera continua o replicaciones destinadas a conservar la continuidad empresarial. 

Más información sobre los precios de DataSync
Más información acerca de los precios

AWS DataSync tiene precios simples, predecibles, con base en el uso y pasa solo por la cantidad de datos que copia.  

Más información 
Regístrese para obtener una cuenta de AWS
Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS. 

 

Registrarse 
Comience a usar DataSync en la consola
Comience a migrar datos en la consola

Comience a crear con AWS DataSync en la consola de AWS.

Iniciar sesión