Aspectos generales

P: ¿Qué es AWS DataSync?

R: AWS DataSync es un servicio de transferencia de datos en línea que simplifica, automatiza y acelera la copia de grandes cantidades de datos entre los sistemas de almacenamiento en las instalaciones y los servicios de almacenamiento de AWS, así como entre estos últimos. DataSync puede copiar datos entre recursos compartidos del sistema de archivos de red (NFS), recursos compartidos del bloque de mensajes del servidor (SMB), sistemas de archivos distribuidos de Hadoop (HDFS), almacenamiento de objetos autoadministrados, Google Cloud Storage, archivos Azure, AWS Snowcone, Amazon Simple Storage Service (Amazon S3) y sistemas de archivos de Amazon Elastic File System (Amazon EFS), Amazon FSx para Windows File Server, Amazon FSx para LustreAmazon FSx para OpenZFS y Amazon FSx para NetApp ONTAP.

P: ¿Por qué debería usar AWS DataSync?

R: AWS DataSync le permite copiar grandes conjuntos de datos con millones de archivos sin necesidad de crear soluciones personalizadas con herramientas de código abierto o autorizar y administrar un software costoso de aceleración de red comercial. Con DataSync puede migrar datos activos hacia AWS, archivar datos para liberar espacio de almacenamiento local, replicar datos en AWS para la continuidad empresarial o transferir datos a la nube para realizar tareas de análisis y procesamiento.

P: ¿Qué problemas resuelve AWS DataSync?

R: AWS DataSync reduce la complejidad y el costo de la transferencia de datos en línea, lo que hace que sea sencillo transferir conjuntos de datos entre el almacenamiento local, en el borde o en otra nube y los servicios de almacenamiento de AWS, así como entre estos últimos. DataSync se conecta a los sistemas de almacenamiento existentes y a los orígenes de datos con protocolos de almacenamiento estándar (NFS, SMB), como cliente de HDFS o mediante la API de Amazon S3. Usa un protocolo de red personalizado y arquitectura escalable para acelerar la transferencia de datos entre los sistemas de almacenamiento y el servicio de AWS. DataSync escala y maneja de forma automática todas las tareas implicadas en el movimiento de datos y objetos, el programa de transferencias de datos, el monitoreo del progreso de las transferencias, el cifrado, la verificación de las transferencias de datos y la notificación al cliente sobre cualquier falla. Con DataSync, solo paga por la cantidad de datos copiados, sin compromisos mínimos ni pagos iniciales.

P: ¿A dónde y desde dónde se pueden transferir los datos?
R: DataSync admite los siguientes tipos de ubicaciones de almacenamiento: recursos compartidos de sistemas de archivos de red (NFS), recursos compartidos de bloques de mensajes de servidor (SMB), sistemas de archivos distribuidos de Hadoop (HDFS), almacenamiento de objetos autoadministrados, Google Cloud Storage, archivos Azure, AWS Snowcone, Amazon Simple Storage Service (Amazon S3) y sistemas de archivos de Amazon Elastic File System (Amazon EFS), Amazon FSx para Windows File Server, Amazon FSx para Lustre, Amazon FSx para OpenZFS y Amazon FSx para NetApp ONTAP.

P: ¿Cómo se usa AWS DataSync para migrar datos a AWS?

R: Puede usar AWS DataSync para migrar datos ubicados en las instalaciones, en la periferia o en otras nubes a Amazon S3, Amazon EFS, Amazon FSx para Windows File Server, Amazon FSx para Lustre, Amazon FSx para OpenZFS y Amazon FSx para NetApp ONTAP. Configure DataSync para hacer una copia inicial de todo el conjunto de datos, y programe transferencias progresivas posteriores de datos cambiantes hasta la transición final desde los datos en las instalaciones a AWS. DataSync incluye cifrado y validación de integridad para ayudarlo a garantizar que sus datos lleguen de manera segura, intacta y lista para usar. A fin de disminuir el impacto sobre las cargas de trabajo que utilizan su conexión de red, puede programar su migración para que se ejecute durante las horas no pico, o limitar el ancho de banda de la red que DataSync usa mediante la configuración del limitador de ancho de banda integrado. DataSync conserva los metadatos entre sistemas de almacenamiento que tienen estructuras de metadatos similares, lo que permite realizar una transición suave de usuarios finales y aplicaciones al usar su servicio de almacenamiento de AWS de destino. Lea la publicación del blog de almacenamiento, “Migración de almacenamiento con AWS DataSync” para obtener consejos y más información sobre las prácticas recomendadas de migración.

P: ¿Cómo utilizo AWS DataSync para archivar datos inactivos?

R: Puede utilizar AWS DataSync para transferir datos inactivos desde los sistemas de almacenamiento locales directamente hasta ubicaciones de almacenamiento a largo plazo duraderas y seguras, como Amazon S3 Glacier Flexible Retrieval (antes conocido como S3 Glacier) o Amazon S3 Glacier Deep Archive. Utilice la funcionalidad de filtrado de DataSync para excluir la copia de archivos y carpetas temporales o copiar solo un subconjunto de archivos de su ubicación de origen. Puede seleccionar el servicio de almacenamiento más rentable según sus necesidades: transferencia de datos a cualquier clase de almacenamiento de S3 o usar DataSync con la administración del ciclo de vida EFS para almacenar los datos en la clase de almacenamiento de acceso poco frecuente Amazon EFS (EFS IA). Use la funcionalidad para programación de tareas integrada si desea archivar periódicamente los datos que se deben retener con fines de conformidad o auditoría, como registros, imágenes de video sin procesar o registros médicos electrónicos. 

P: ¿Cómo uso AWS DataSync para replicar los datos en AWS a fin de garantizar la continuidad empresarial?

R: Con AWS DataSync, puede replicar periódicamente archivos en cualquier clase de almacenamiento de Amazon S3 o enviar los datos a Amazon EFS, Amazon FSx para Windows File Server, Amazon FSx para Lustre, Amazon FSx para OpenZFS o Amazon FSx para NetApp ONTAP para un sistema de archivos en espera. Use la funcionalidad para programación de tareas integrada a fin de garantizar que los cambios en el conjunto de datos se copien periódicamente en el almacenamiento de destino. Lea esta publicación del blog sobre AWS Storage para obtener más información acerca de cómo proteger los datos con AWS DataSync.

P: ¿Cómo utilizo AWS DataSync para transferencias recurrentes entre el almacenamiento en las instalaciones y AWS para flujos de trabajo continuos?

R: Puede usar AWS DataSync para las transferencias continuas desde los sistemas en las instalaciones hacia dentro o fuera de AWS para el procesamiento. DataSync permite acelerar los flujos de trabajo de almacenamiento híbrido y crítico en la nube en sectores que necesitan transferir archivos a AWS rápidamente. Eso incluye aprendizaje automático en ciencias biológicas, creación de videos con contenido multimedia y de entretenimiento, análisis de big data en servicios financieros e investigación sísmica en el área de petróleo y gas. DataSync ofrece una entrega oportuna para garantizar que los procesos dependientes no se demoren. Puede especificar un filtro de exclusión, un filtro de inclusión, o ambos, para determinar qué archivos, carpetas u objetos se deben transferir cada vez que se ejecute una tarea.

P: ¿Se puede utilizar AWS DataSync para copiar datos procedentes de otras nubes públicas en AWS?

R: Sí. Mediante AWS DataSync, puede copiar datos a partir de Google Cloud Storage mediante la API de S3, o a partir de Azure Files mediante el protocolo SMB. Simplemente implemente el agente de DataSync en el entorno en la nube o en Amazon EC2, cree las ubicaciones de origen y destino y, a continuación, inicie la tarea para comenzar a copiar los datos. Obtenga más información sobre el uso de DataSync para copiar datos a partir de Google Cloud Storage o de Azure Files.

P: ¿Se puede utilizar AWS DataSync para crear un lago de datos?

R: Sí. Es fácil crear un lago de datos con AWS DataSync, mediante la automatización de la transferencia de conjuntos de datos locales o de datos en otras nubes a Amazon S3. DataSync permite una transferencia sencilla y rápida de todo el conjunto de datos mediante protocolos de almacenamiento estándar (NFS, SMB), como cliente de HDFS o la API de Amazon S3. Después de transferir el conjunto de datos inicial, puede programar transferencias posteriores de nuevos datos a AWS. DataSync incluye el cifrado y la validación de la integridad para garantizar que los datos lleguen seguros, intactos y listos para su uso. A fin de disminuir el impacto sobre las cargas de trabajo que utilizan su conexión de red, puede programar las tareas de transferencia para que se ejecuten durante las horas de menor demanda, o limitar el ancho de banda de la red que DataSync usa mediante la configuración del limitador de ancho de banda integrado. Cuando los datos estén depositados en Amazon S3, podrá usar servicios de AWS nativos para ejecutar aplicaciones de análisis de big data, inteligencia artificial (IA), aprendizaje automático, informática de alto rendimiento y procesamiento de datos multimedia para obtener información a partir de conjuntos de datos no estructurados. Consulte la página web sobre almacenamiento en lagos de datos de AWS para obtener más información sobre la creación y cómo sacarle partido a su lago de datos.

P: ¿Cómo uso AWS DataSync para transferir datos entre los servicios de AWS Storage?

R: Puede usar DataSync para transferir archivos u objetos entre Amazon S3, Amazon EFS, Amazon FSx para Windows File Server, Amazon FSx para Lustre, Amazon FSx para OpenZFS o Amazon FSx para NetApp ONTAP dentro de la misma cuenta de AWS. Puede transferir datos entre los servicios de AWS en la misma región de AWS, entre los servicios en regiones comerciales diferentes de AWS en China o entre regiones de AWS GovCloud (Este y Oeste de EE. UU.). Esto no requiere implementar un agente de DataSync y se puede configurar de extremo a extremo mediante la consola de AWS DataSync, la interfaz de línea de comandos (CLI) o el kit de desarrollo de software (SDK) de AWS.

P: ¿Puedo usar AWS DataSync para migrar a Amazon WorkDocs?

R: Sí. AWS DataSync acelera un paso necesario para el servicio de migración de Amazon WorkDocs mediante la automatización de la carga de archivos al bucket de Amazon S3 que se usa para la migración. DataSync facilita y agiliza la migración de directorios principales y archivos compartidos de departamentos a WorkDocs. Para obtener más información acerca de cómo usar DataSync para migrar a WorkDocs, lea la publicación de blog “Migrating network file shares to Amazon WorkDocs using AWS DataSync”.

Uso

P: ¿Cómo puedo comenzar a utilizar AWS DataSync?

R: Puede transferir los datos mediante AWS DataSync con unos pocos clics en la consola de administración de AWS o mediante la interfaz de línea de comandos (CLI) de AWS. Para comenzar, siga estos tres pasos:

1. Para transferir datos entre sistemas de almacenamiento locales, en el borde o en otras nubes y los servicios de almacenamiento de AWS, implemente un agente: implemente un agente de DataSync y asócielo a la cuenta de AWS mediante la consola de administración o la API. El agente se utilizará para acceder al servidor NFS, al recurso compartido de archivos SMB, al clúster Hadoop o al almacenamiento de objetos autoadministrado o en la nube para leer o escribir datos. No es necesario implementar un agente para transferir datos entre los servicios de almacenamiento de AWS en la misma cuenta de AWS.

2. Cree una tarea de transferencia de datos: cree una tarea mediante la especificación de la ubicación del origen y el destino de los datos, y cualquier opción que desee usar para configurar la transferencia, como la programación deseada de las tareas.

3. Inicie la transferencia: inicie la tarea y monitoree la migración de los datos en la consola o con Amazon CloudWatch.

P: ¿Cómo implemento un agente de AWS DataSync?

R: Se implementa un agente de AWS DataSync en el hipervisor local, en el entorno de la nube pública o en Amazon EC2. Para copiar datos en un servidor de archivos local o desde este, descargue la imagen de la máquina virtual del agente desde la consola de AWS e impleméntela en el hipervisor local VMware ESXi, la máquina virtual basada en el kernel de Linux (KVM) o Microsoft Hyper-V. Cuando se utiliza un agente de DataSync, el agente debe implementarse para que pueda acceder a su servidor de archivos mediante el protocolo NFS, SMB, acceder a NameNodes y DataNodes en su clúster de Hadoop, o acceder a su almacenamiento de objetos autoadministrado mediante la Amazon API S3. Para configurar transferencias entre su S3 en los buckets de AWS Outposts y los buckets de S3 en las Regiones de AWS, implemente el agente en su Outpost. Para configurar transferencias entre el dispositivo AWS Snowcone y un servicio de almacenamiento de AWS, use la AMI del agente de DataSync que ya viene instalada en el dispositivo.

No es necesario implementar un agente para transferir datos entre los servicios de AWS Storage en la misma cuenta de AWS. Para copiar datos de un servidor de archivos autoadministrados en la nube o en él, o entre los servicios de AWS Storage en diferentes cuentas de AWS, lance una instancia de Amazon EC2 con una AMI del agente de DataSync.

P: ¿Cuáles son los recursos necesarios para ejecutar el agente de AWS DataSync?

R: Los recursos mínimos que necesita para ejecutar el agente se pueden consultar aquí.

P: ¿Cómo inicio una tarea de transferencia de datos de AWS DataSync?

R: AWS DataSync copia los datos cuando se inicia una tarea mediante la consola de administración de AWS o la interfaz de línea de comandos (CLI) de AWS. Cada vez que se ejecuta una tarea, se escanea el origen y el destino en busca de cambios y se realiza una copia de cualquier diferencia entre los datos y los metadatos del origen y el destino. Puede configurar qué características del origen se usarán para determinar las diferencias, definir filtros para incluir y excluir archivos o carpetas específicos y controlar si los archivos u objetos en el destino deben sobrescribirse cuando se cambian en el origen o eliminarse cuando no se encuentran en el origen.

P: ¿Cómo se asegura AWS DataSync de que mis archivos se hayan copiado correctamente?

R: Como AWS DataSync transfiere y almacena datos, realiza controles de integridad para garantizar que los datos escritos en el destino coincidan con los datos leídos en el origen. Además, se puede realización un control de verificación opcional para comparar el origen y el destino una vez finalizada la transferencia. DataSync calculará y comparará las sumas de comprobación de todos los archivos de los datos almacenados en el origen y en el destino. Puede verificar todo el conjunto de datos o solo los archivos u objetos que DataSync transfirió.

P: ¿Cómo puedo controlar el estado de los datos que AWS DataSync está transfiriendo?

R: Puede usar la consola de administración de AWS o la CLI para controlar el estado de los datos que se están transfiriendo. Con las métricas de Amazon CloudWatch, puede ver la cantidad de archivos y de datos que se ha copiado. También puede activar el registro de archivos individuales en CloudWatch Logs para identificar las transferencias que se han producido en un momento específico, además de los resultados de verificación de integridad del contenido que realiza DataSync. De este modo, se simplifican las labores de monitoreo, generación de informes y solución de problemas, y puede ofrecer actualizaciones rápidas a los interesados. Puede obtener información adicional, como el avance de la transferencia, en la consola de administración de AWS o la CLI.

P: ¿Puedo filtrar los archivos y las carpetas que transfiere AWS DataSync?

R: Sí. Puede especificar un filtro de exclusión, un filtro de inclusión, o ambos, para limitar qué archivos, carpetas u objetos deben transferirse cada vez que se ejecute una tarea. Incluir filtros especifica las rutas de archivo o claves de objeto que deben incluirse cuando se ejecuta la tarea y limita el alcance de lo que DataSync analiza en el origen y el destino. Los filtros de exclusión especifican las rutas de archivo o las claves de objeto que deben excluirse de la copia. Si no se configura ningún filtro, cada vez que se ejecute una tarea, esta transferirá todos los cambios desde el origen al destino. Al crear o actualizar una tarea, puede configurar los filtros de exclusión e inclusión. Al comenzar una tarea, puede anular los filtros configurados en la tarea. Consulte este blog sobre almacenamiento AWS para informarse más sobre el uso de filtros comunes con DataSync para más información.

P: ¿Puedo configurar AWS DataSync para transferir según un programa?

R: Sí. Puede organizar sus tareas con la consola AWS DataSync o la interfaz de línea de comandos (CLI) AWS, sin necesidad de escribir ni ejecutar scripts para administrar las transferencias repetidas. La organización de las tareas ejecuta, de manera automática, las tareas según el programa que configuró, con opciones cada hora, por día o semanales, que se indican directamente en la consola. Esto le permite garantizar que los cambios en el conjunto de datos se detectan y copian automáticamente en el almacenamiento de destino.

P: ¿AWS DataSync conserva la estructura del directorio cuando copia archivos?

R: Sí. Cuando transfiere archivos, AWS DataSync crea la misma estructura de directorio en el destino que en la ubicación de origen.

P: ¿Qué sucede si se interrumpe una tarea de AWS DataSync?

R: Si se interrumpe una tarea (por ejemplo, si la conexión de red falla o el agente de AWS DataSync se reinicia) la siguiente ejecución de la tarea transferirá los archivos faltantes y los datos estarán completos y serán congruentes al finalizar la ejecución. Cada vez que se inicia una tarea, se realiza una copia gradual y se transfieren únicamente los cambios desde el origen al destino.

P: ¿Puedo usar AWS DataSync con AWS Direct Connect?

R: Sí. Puede utilizar AWS DataSync con su enlace de Direct Connect para obtener acceso a los puntos de enlace de los servicios públicos o los puntos de enlace de la VPC privados. Con los puntos de enlace de la VPC, los datos transferidos entre el agente de DataSync y los servicios de AWS no atraviesan la Internet pública ni necesitan direcciones IP públicas, lo que aumenta la seguridad de los datos a medida que se copian a través de la red.

P: ¿AWS DataSync admite los puntos de enlace de la VPC o de AWS PrivateLink?

R: Sí. Puede utilizar los puntos de enlace de la VPC para garantizar que la transferencia de datos con su agente de AWS DataSync, implementado de forma local o en la nube, no atraviese redes públicas de Internet ni requiera el uso de direcciones de IP públicas. El uso de los puntos de enlace de la VPC aumenta la seguridad de sus datos ya que mantiene el tráfico de la red dentro de su Amazon Virtual Private Cloud (Amazon VPC). Los puntos de enlace de la VPC para DataSync funcionan con AWS PrivateLink, una tecnología escalable de alta disponibilidad que le permite conectar de forma privada su VPC a los servicios de AWS compatibles.

P: ¿Cómo configuro AWS DataSync para poder utilizar los puntos de enlace de la VPC?

R: Para poder utilizar los puntos de enlace de la VPC con AWS DataSync, debe crear un punto de enlace de la VPC de interfaz AWS PrivateLink para el servicio DataSync en la VPC de su elección y, a continuación, elegir esta interfaz de red elástica (ENI) de punto de enlace al momento de crear el agente de DataSync. El agente se conectará con esta ENI para activarse y, posteriormente, todos los datos transferidos por el agente permanecerán dentro de la VPC que configuró. Puede utilizar la consola de AWS DataSync, la interfaz de línea de comandos de AWS (CLI) o AWS SDK para configurar los puntos de enlace de la VPC. Para obtener más información, consulte Utilizar AWS DataSync en una nube virtual privada.

Transferencias desde y hacia Amazon S3

P: ¿Puedo copiar mis datos en Amazon S3 Glacier Flexible Retrieval (antes conocido como S3 Glacier), Amazon S3 Glacier Deep Archive u otras clases de almacenamiento S3?

R: Sí. Durante la configuración de un bucket S3 para usar con AWS DataSync, puede seleccionar la clase de almacenamiento S3 que DataSync usa para almacenar objetos. DataSync admite el almacenamiento de datos directamente en S3 Standard, S3 Intelligent-Tiering, S3 Standard-Infrequent Access (S3 Standard-IA), S3 One Zone-Infrequent Access (S3 One Zone-IA), Amazon S3 Glacier Flexible Retrieval y Amazon S3 Glacier Deep Archive (S3 Glacier Deep Archive). Puede encontrar más información sobre los Tipos de almacenamiento de Amazon S3 en la Guía para desarrolladores de Amazon Simple Storage Service.

Los objetos más pequeños que la capacidad de carga mínima por objeto se almacenarán en S3 Estándar. Por ejemplo, los objetos de carpeta, que tienen un tamaño de cero bytes y contienen solo metadatos, se almacenarán en S3 Estándar. Lea sobre consideraciones al trabajar con los tipos de almacenamiento de Amazon S3 en nuestra documentación. Para obtener más información sobre las capacidades de carga mínima, consulte Precios de Amazon S3.

P: ¿Puedo copiar los datos de las clases de almacenamiento Estándar - Acceso poco frecuente de S3 y Única zona - Acceso poco frecuente de S3?

R: Sí. Al usar S3 como la ubicación de origen para una tarea AWS DataSync, el servicio recuperará todos los objetos del bucket que deben copiarse en el destino. La recuperación de objetos del almacenamiento Estándar - Acceso poco frecuente de S3 y Única zona - Acceso poco frecuente de S3 generará una tarifa de recuperación basada en el tamaño de los objetos. Lea sobre las consideraciones al trabajar con los tipos de almacenamiento de Amazon S3 en nuestra documentación.

P: ¿Puedo copiar datos fuera de Amazon S3 Glacier Flexible Retrieval (antes conocido como S3 Glacier) y Amazon S3 Glacier Deep Archive?

R: Al usar S3 como la ubicación de origen para una tarea de AWS DataSync, el servicio intentará recuperar todos los objetos del bucket que deben copiarse en el destino. La recuperación de objetos archivados en la clase de almacenamiento S3 Glacier Flexible Retrieval o S3 Glacier Deep Archive produce un error. DataSync registrará cualquier error al recuperar objetos archivados y dará como resultado un estado de finalización de tarea fallido. Lea sobre las consideraciones al trabajar con los tipos de almacenamiento de Amazon S3 en nuestra documentación.

P: ¿Cómo obtiene acceso AWS DataSync a mi bucket de Amazon S3?

R: AWS DataSync asume un rol de IAM que usted proporciona. La política que adjunte al rol determina qué acciones puede realizar el rol. DataSync puede generar automáticamente este rol en su nombre. También puede seguir la para configurarlo manualmente.

P: ¿Cómo hace AWS DataSync para convertir archivos y carpetas desde o hacia objetos en Simple Storage Service (Amazon S3)?

R: Cuando los archivos o las carpetas se copian a Amazon S3, existe una relación de uno a uno entre un archivo o una carpeta y un objeto. Las marcas de tiempo de los archivos y las carpetas y los permisos POSIX, que incluyen ID de usuarios, ID de grupos y permisos, se almacenan en los metadatos de los usuarios de S3. Para compartir con NFS, los metadatos de archivos almacenados en los metadatos de usuario en S3 son totalmente interoperables con el Gateway de archivos, lo que permite que AWS DataSync ofrezca acceso en las instalaciones basado en archivos a los datos almacenados en Amazon S3.

Cuando DataSync vuelve a copiar objetos que contienen los metadatos de este usuario en el servidor NFS, los metadatos del archivo se restauran. También se restauran los enlaces simbólicos y duros cuando se copian desde NFS a S3.

Cuando se realiza una copia desde un archivo compartido de SMB, los permisos POSIX predeterminados se almacenan en los metadatos del usuario de S3. Cuando se vuelve a hacer una copia en un archivo compartido de SMB, el propietario se establece según el usuario que estaba habilitado para acceder a ese archivo compartido en DataSync y se le asignan permisos predeterminados.

Al copiar desde HDFS, las marcas de tiempo de archivos y carpetas, la propiedad de usuarios y grupos y los permisos POSIX se almacenan en los metadatos de usuario de S3. Al copiar de Amazon S3 a HDFS, se restablecen los metadatos de archivos y carpetas.

Obtenga más información sobre cómo DataSync almacena archivos y metadatos en nuestra documentación.

P: ¿Qué metadatos de objetos se conservan al transferir objetos entre el almacenamiento de objetos autoadministrado y Amazon S3?

R: Cuando se transfieren objetos entre el almacenamiento de datos autoadministrado y Amazon S3, DataSync copia los objetos junto con las etiquetas y los metadatos del objeto.

P: ¿Qué metadatos de los objetos se preservan cuando se transfieren objetos entre los buckets de Amazon S3?

R: Cuando se transfieren objetos entre los buckets de Amazon S3, DataSync copia los objetos junto con las etiquetas y los metadatos del objeto. DataSync no copia otra información de los objetos, como su ACL o sus versiones anteriores.

P: ¿Qué costos de solicitud y almacenamiento de Amazon S3 se aplican cuando se usan los tipos de almacenamiento de S3 con AWS DataSync?

R: Algunas clases de almacenamiento de S3 tienen comportamientos que pueden afectar su costo, como la recuperación de datos, las capacidades mínimas de almacenamiento y las duraciones mínimas de almacenamiento. DataSync automatiza la gestión de datos para abordar estos factores y proporciona configuraciones para minimizar la recuperación de datos.

A fin de evitar la carga por objeto de capacidad mínima, AWS DataSync automáticamente almacena los objetos pequeños en S3 estándar. A fin de disminuir las tarifas de recuperación de datos, puede configurar DataSync de manera que solamente valide los archivos que transfirió una tarea determinada. A fin de evitar los cargos mínimos por duración de almacenamiento, DataSync posee controles para la sobrescritura y eliminación de objetos. Lea sobre las consideraciones al trabajar con los tipos de almacenamiento de Amazon S3 en nuestra documentación.

P: ¿Puedo copiar datos de objetos desde y hacia los buckets de Amazon S3 en AWS Outposts?

R: Sí. Puede copiar objetos entre Amazon S3 en AWS Outposts y buckets de Amazon S3 en las regiones de AWS. AWS DataSync copia objetos junto con los metadatos y las etiquetas del objeto. Para que DataSync acceda a su Amazon S3 en los buckets de Outposts, implemente un agente de DataSync EC2 en su Outpost.

Al usar DataSync con Amazon S3 en Outposts, solo puede transferir datos hacia y desde buckets de Amazon S3 en las regiones de AWS. Puede obtener más información sobre las fuentes y destinos admitidos para las tareas de DataSync en nuestra documentación.

Transferencias desde y hacia Amazon EFS

P: ¿Cómo obtiene acceso AWS DataSync a mi sistema de archivos de Amazon EFS?

R: AWS DataSync obtiene acceso a su sistema de archivos Amazon EFS mediante el protocolo NFS. El servicio de DataSync organiza su sistema de archivos desde su VPC desde interfaces de red elásticas (ENI) que administra el servicio DataSync. DataSync se encarga de administrar por completo la creación, el uso y la eliminación de estas ENI. Puede elegir montar su sistema de archivos EFS mediante un destino de montaje o un punto de acceso a EFS.

P: ¿Puedo usar AWS DataSync con todos los tipos de almacenamiento de Amazon EFS?

R: Sí. Puede usar AWS DataSync a fin de copiar archivos en Amazon EFS y configurar la administración del ciclo de vida de EFS para migrar los archivos a los que no se accedió durante un periodo determinado al tipo de almacenamiento de acceso poco frecuente.

P: ¿Cómo se utiliza AWS DataSync con las políticas de recursos del sistema de archivos de Amazon EFS?

R: Puede utilizar tanto las políticas de identidad de IAM como las políticas de recursos para controlar el acceso de los clientes a los recursos de Amazon EFS de manera que sea escalable y se optimice para los entornos en la nube. Cuando crea una ubicación de DataSync para su sistema de archivos de EFS, puede especificar un rol de IAM que DataSync deberá asumir cuando acceda a EFS. A continuación, podrá utilizar las políticas del sistema de archivos de EFS para configurar el acceso para el rol de IAM. Dado que DataSync monta sistemas de archivos de EFS como usuarios raíz, su política de IAM debe permitir la siguiente acción: elasticfilesystem:ClientRootAccess.

P: ¿Puedo usar AWS DataSync para replicar el sistema de archivos de Amazon EFS en una región diferente de AWS?

R: Sí. Además de la replicación integrada que ofrece Amazon EFS, también puede utilizar AWS DataSync para programar la replicación periódica del sistema de archivos de Amazon EFS en un sistema de archivos de Amazon EFS secundario dentro de la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

P: ¿Qué metadatos se preservan cuando se copian datos entre el recurso compartido de NFS y Amazon EFS o entre dos sistemas de archivos de Amazon EFS?

R: AWS DataSync copia las marcas de tiempo de los archivos y las carpetas y los permisos POSIX, que incluyen ID de usuarios, ID de grupos y permisos. Puede obtener más información y ver la lista completa de metadatos copiados en nuestra documentación.

P: ¿Qué metadatos se conservan al copiar datos entre HDFS y Amazon EFS?

R: AWS DataSync copia las marcas de tiempo de archivos y carpetas y los permisos POSIX y aplica valores predeterminados para el ID de usuario y el ID de grupo. Puede obtener más información y ver la lista completa de metadatos copiados en nuestra documentación.

Transferencias desde y hacia Amazon FSx para Windows File Server

P: ¿Cómo accede AWS DataSync a mi sistema de archivos de Amazon FSx para Windows File Server?

R: AWS DataSync accede a su sistema de archivos de Amazon FSx para Windows File Server mediante el protocolo SMB, a través de la autenticación con el nombre de usuario y la contraseña que configure en la consola de AWS o en la CLI. El servicio de DataSync organiza su sistema de archivos desde su VPC desde interfaces de red elásticas (ENI) que administra el servicio DataSync. DataSync se encarga de administrar por completo la creación, el uso y la eliminación de estas ENI por usted.

P: ¿Qué metadatos de Windows se transfieren cuando se hacen copias de un recurso compartido de SMB al sistema de archivos de Amazon FSx for Windows File Server o entre dos sistemas de archivos de Amazon FSx?

R: AWS DataSync copia los metadatos de Windows, incluidas las marcas de tiempo del archivo, el propietario del archivo, los atributos de archivo estándar, las listas de acceso discrecional (DACL) de NTFS y las listas de control de acceso al sistema de NFTS (SACL). Puede obtener más información y ver la lista completa de metadatos copiados en nuestra documentación.

P: ¿Puedo usar AWS DataSync para replicar el sistema de archivos de Amazon FSx for Windows File Server en otra región de AWS?

R: Sí. Puede usar AWS DataSync para programar replicaciones periódicas del sistema de archivos de Amazon FSx for Windows File Server en otro sistema de archivos en la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

Transferencias desde y hacia Amazon FSx for Lustre

P: ¿Cómo obtiene acceso AWS DataSync a mi sistema de archivos de Amazon FSx for Lustre?

R: Cuando crea una tarea de DataSync para copiar hacia o desde su sistema de archivos FSx for Lustre, el servicio DataSync creará interfaces de red elásticas (ENI) en la misma VPC y subred donde se encuentra el sistema de archivos.  DataSync utiliza estas ENI para acceder al sistema de archivos FSx for Lustre mediante el protocolo Lustre como usuario raíz.  Cuando crea un recurso de ubicación DataSync para su sistema de archivos FSx for Lustre, puede especificar hasta cinco grupos de seguridad para aplicar a los ENI y configurar el acceso de salida desde el servicio DataSync.  Los grupos de seguridad se deben configurar para permitir el tráfico de salida en los puertos de red requeridos por FSx for Lustre.  Los grupos de seguridad del sistema de archivos de FSx for Lustre deben configurarse para permitir el acceso entrante desde los grupos de seguridad que se asignaron al recurso de ubicación de DataSync para el sistema de archivos FSx for Lustre.

P: ¿Qué metadatos se conservan al copiar datos entre un recurso compartido NFS o un sistema de archivos de Amazon EFS y Amazon FSx for Lustre, o entre dos sistemas de archivos de Amazon FSx para Lustre?

R: AWS DataSync copia las marcas de tiempo de los archivos y las carpetas y los permisos POSIX, que incluyen ID de usuarios, ID de grupos y permisos. Puede obtener más información y ver la lista completa de metadatos copiados en nuestra documentación.

P: ¿Puedo utilizar AWS DataSync para migrar datos de un sistema de archivos FSx for Lustre a otro?

R: Sí. Puede utilizar AWS DataSync para copiar desde su sistema de archivos FSx for Lustre a un segundo sistema de archivos dentro de la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

P: ¿Puedo usar AWS DataSync para replicar el sistema de archivos de Amazon FSx for Lustre en una región diferente de AWS?

R: Sí. Puede usar AWS DataSync para programar replicaciones periódicas del sistema de archivos de Amazon FSx for Lustre en otro sistema de archivos en la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

P: ¿DataSync copiará las configuraciones de segmentación o disposición cuando se copie de un sistema de archivos de Amazon FSx for Lustre a otro?

R: No. Los archivos se escriben con la configuración de distribución y segmentación de archivos en el sistema de archivos de destino.

Transferencia de datos desde y hacia Amazon FSx for OpenZFS

P: ¿Cómo obtiene acceso AWS DataSync a mi sistema de archivos de Amazon FSx for OpenZFS?

R: Cuando crea una tarea de DataSync para copiar hacia o desde su sistema de archivos FSx for OpenZFS, el servicio DataSync creará interfaces de red elásticas (ENI) en la misma VPC y subred donde se encuentra el sistema de archivos.  DataSync utiliza estas ENI para acceder al sistema de archivos FSx for OpenZFS mediante el protocolo OpenZFS como usuario raíz.  Cuando crea un recurso de ubicación DataSync para su sistema de archivos FSx for OpenZFS, puede especificar hasta cinco grupos de seguridad para aplicar a los ENI y configurar el acceso de salida desde el servicio DataSync.  Los grupos de seguridad se deben configurar para permitir el tráfico de salida en los puertos de red requeridos por OpenZFS. Los grupos de seguridad del sistema de archivos de FSx for OpenZFS deben configurarse para permitir el acceso entrante desde los grupos de seguridad que se asignaron al recurso de ubicación de DataSync para el sistema de archivos FSx for OpenZFS.

P: ¿Qué metadatos se conservan al copiar datos entre un recurso compartido NFS o un sistema de archivos de Amazon EFS y Amazon FSx for OpenZFS, o entre dos sistemas de archivos de Amazon FSx for OpenZFS?

R: AWS DataSync copia las marcas de tiempo de los archivos y las carpetas y los permisos POSIX, que incluyen ID de usuarios, ID de grupos y permisos. Puede obtener más información y ver la lista completa de metadatos copiados en nuestra documentación.

P: ¿Puedo utilizar AWS DataSync para migrar datos de un sistema de archivos FSx for OpenZFS a otro?

R: Sí. Puede utilizar AWS DataSync para copiar desde su sistema de archivos FSx for OpenZFS a un segundo sistema de archivos dentro de la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

P: ¿Puedo usar AWS DataSync para replicar el sistema de archivos de Amazon FSx for OpenZFS en una región diferente de AWS?

R: Sí. Puede usar AWS DataSync para programar replicaciones periódicas del sistema de archivos de Amazon FSx for OpenZFS en otro sistema de archivos en la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

Transferencias hacia y desde Amazon FSx para NetApp ONTAP

P: ¿Cómo accede AWS DataSync a mi sistema de archivos de Amazon FSx para NetApp ONTAP?

R: Cuando crea una tarea, DataSync genera interfaces de la red elástica (ENI) en la subred preferida de la misma VPC en la que se encuentra su sistema de archivos de Amazon FSx para NetApp ONTAP. La subred preferida se configura cuando se crea el sistema de archivos FSx para ONTAP, y DataSync usa las ENI que crea en esa subred para acceder al sistema de archivos de FSx para ONTAP. Al crear un recurso de ubicación de DataSync para su sistema de archivos de FSx para ONTAP, puede especificar hasta 5 grupos de seguridad para aplicar a las ENI para configurar el acceso saliente desde el servicio DataSync. Debe configurar los grupos de seguridad de su sistema de archivos de FSx para ONTAP para permitir el acceso entrante desde los grupos de seguridad que asignó al recurso DataSync Location para su sistema de archivos de FSx para ONTAP.

P: ¿Qué versiones de protocolo puede usar AWS DataSync con Amazon FSx para NetApp ONTAP?

R: AWS DataSync admite usar NFSv3, SMB 2.1 y SMB 3. Actualmente, DataSync no admite usar NFSv4 o posterior con FSx para ONTAP.

P: ¿Conserva AWS DataSync los metadatos del sistema de archivos cuando se copian datos a o desde mi sistema de archivos de Amazon FSx para NetApp ONTAP?

R: Sí, AWS DataSync copia las marcas de tiempo de archivos y carpetas y los permisos POSIX, incluidos el ID de usuario, el ID de grupo y los permisos, cuando se usa el protocolo NFS. Al usar el protocolo SMB, DataSync copia las marcas de tiempo de archivos y carpetas, la propiedad y las ACL. Puede obtener más información y ver la lista completa de metadatos copiados en nuestra documentación.

P: ¿Qué protocolo debo usar al migrar mis datos a Amazon FSx para NetApp ONTAP?

R: Al migrar desde servidores Windows o recursos compartidos NAS que sirven a los usuarios a través del protocolo SMB, use una ubicación de origen de DataSync SMB y el protocolo SMB para su ubicación de FSx para ONTAP, y asegúrese de que el estilo de seguridad de su volumen de FSx para ONTAP esté configurado para NTFS. Al migrar desde servidores Unix o Linux o recursos compartidos NAS que sirven a los usuarios a través del protocolo NFS, use una ubicación de origen NFS de DataSync y el protocolo NFS para su ubicación de FSx para ONTAP, y asegúrese de que el estilo de seguridad de su volumen FSx para ONTAP está configurado para Unix. En el caso de las migraciones multiprotocolo, debería revisar las prácticas recomendadas que se tratan en el blog Enabling multiprotocol workloads with Amazon FSx for NetApp ONTAP (Habilitación de cargas de trabajo multiprotocolo con Amazon FSx para NetApp ONTAP), y usar el protocolo SMB para preservar los metadatos del sistema de archivos con la mayor fidelidad. Para obtener más información sobre la configuración de los estilos de seguridad para sus volúmenes de FSx para ONTAP, consulte la documentación sobre la gestión de los volúmenes de FSx para ONTAP.

P: ¿Puedo usar AWS DataSync para acceder al mismo sistema de archivos de Amazon FSx para NetApp ONTAP mediante diferentes protocolos?

R: Sí, pero tendrá que crear una ubicación de DataSync y un recurso de tarea distintos para cada protocolo (NFS o SMB). Para evitar problemas de sobrescritura de datos y verificación de datos, no recomendamos usar varias tareas DataSync para copiar en la misma ruta de volumen al mismo tiempo (ya sea con el mismo protocolo o con protocolos diferentes).

P: ¿Puedo usar AWS DataSync para transferir datos a o desde LUN iSCSI de Amazon FSx para NetApp ONTAP?

R: No, DataSync solo admite la copia de datos de archivos hacia o desde volúmenes de FSx para ONTAP mediante los protocolos NFS o SMB.

P: ¿Puedo usar AWS DataSync para copiar datos de un sistema de archivos de Amazon FSx para NetApp ONTAP a otro?

R: Sí. Puede usar AWS DataSync para copiar desde su sistema de archivos de FSx para ONTAP a un segundo sistema de archivos dentro de la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

P: ¿Puedo usar AWS DataSync para replicar mi sistema de archivos de Amazon FSx para NetApp ONTAP a un sistema de archivos diferente en otra región de AWS?

R: Aunque DataSync puede usarse para replicar datos entre sus sistemas de ficheros, recomendamos usar NetApp SnapMirror para replicar entre sus sistemas de archivos de FSx para ONTAP. SnapMirror le permite conseguir un RPO bajo, independientemente del número o el tamaño de los archivos de su sistema de archivos.

P: ¿Cómo puedo configurar AWS DataSync para que no copie los directorios de instantáneas?

R: DataSync excluirá automáticamente las carpetas con nombre “.snapshot”. También puede usar filtros de exclusión para evitar la copia de archivos y carpetas que coincidan con los patrones que especifique.

Transferencia hacia y desde AWS Snowcone

P: ¿Cómo transfiero datos entre AWS Snowcone y los servicios de almacenamiento de AWS?

R: El agente de DataSync viene preinstalado en su dispositivo Snowcone como una AMI. Para transferir datos en línea a AWS, conecte el dispositivo AWS Snowcone a la red externa y use AWS OpsHub o la CLI para lanzar la AMI del agente de DataSync. Active el agente mediante la consola de administración de AWS o la CLI y configure su tarea de transferencia de datos en línea entre el almacén NFS de AWS Snowcone y Amazon S3, Amazon EFS, Amazon FSx para Windows File Server, Amazon FSx para Lustre, Amazon FSx para OpenZFS o Amazon FSx para NetApp ONTAP.

Rendimiento

P: ¿Con qué velocidad AWS DataSync copia mi sistema de archivos a AWS?

R: La velocidad con la cual AWS DataSync puede copiar un conjunto de datos determinado depende de la cantidad de datos, del ancho de banda de E/S que se pueda alcanzar desde el origen y el almacenamiento de destino, del ancho de banda de red disponible y de las condiciones de la red. Para transferir archivos entre servicios en las instalaciones y de AWS Storage, una sola tarea de DataSync puede usar todo un enlace de red de 10 Gbps.

P: ¿Puedo controlar la cantidad de ancho de banda de red que puede usar una tarea de AWS DataSync?

R: Sí. Puede controlar la cantidad de ancho de banda de red que AWS DataSync usará. Para ello, configure el acelerador de ancho de banda integrado. Puede aumentar o reducir este límite mientras la tarea de transferencia de datos se esté ejecutando. Esto le permite minimizar el impacto en los demás usuarios o aplicaciones que utilizan la misma conexión de red.

P: ¿Cómo puedo monitorear el rendimiento de AWS DataSync?

R: AWS DataSync genera métricas de Amazon CloudWatch para ofrecer visibilidad granular en el proceso de transferencia. Mediante estas métricas, puede ver la cantidad de archivos y de datos que se han copiado, además de la detección de archivos y el progreso de validación. En la consola de DataSync se muestran directametne gráficos de CloudWatch con estas métricas.

P: ¿AWS DataSync afectará el rendimiento de mi sistema de archivos de origen?

R: Según la capacidad del almacén de archivos local y la cantidad y el tamaño de los archivos a transferir, AWS DataSync podría afectar el tiempo de respuesta de los demás clientes cuando obtengan acceso al mismo almacén de datos de origen debido a que el agente lee o escribe los datos desde dicho sistema de almacenamiento. Configurar un límite de ancho de banda para una tarea reducirá este impacto al restringir las operaciones de E/S que se realizarán en su sistema de almacenamiento.

Seguridad y conformidad

P: ¿Se cifran mis datos a medida que se transfieren y almacenan?

R: Sí. Todos los datos transferidos entre el origen y el destino se cifran mediante Transport Layer Security (TLS, que reemplazó a Capa de conexión segura, SSL) Los datos nunca persisten por sí mismos en AWS DataSync. El servicio admite usar el cifrado predeterminado para los buckets de S3, el cifrado del sistema de archivos de Amazon EFS de los datos en reposo y el cifrado de Amazon FSx en reposo y en tránsito.

P: ¿Cómo accede AWS DataSync a mi servidor NFS o a mis archivos compartidos de SMB?

R: AWS DataSync usa un agente que usted implementa en su entorno de TI o en Amazon EC2 para obtener acceso a sus archivos mediante el protocolo NFS o el protocolo SMB. Este agente se conecta con los puntos de enlace del servicio DataSync dentro de AWS y se administran de manera segura a partir de la consola de administración de AWS o la CLI.

P: ¿Cómo accede AWS DataSync a HDFS en mi clúster de Hadoop?

R: AWS DataSync usa un agente que implementa en su entorno de TI o en Amazon EC2 para acceder a su clúster de Hadoop. El agente DataSync actúa como un cliente HDFS y se comunica con NameNodes y DataNodes en sus clústeres. Cuando inicia una tarea, DataSync consulta el NameNode principal para determinar las ubicaciones de los archivos y carpetas en el clúster. A continuación, DataSync se comunica con los DataNodes del clúster para copiar archivos y carpetas en, o a partir de, HDFS.

P: ¿De qué manera AWS DataSync accede al almacenamiento de objetos autoadministrado o en la nube?

R: AWS DataSync utiliza un agente que se implementa en el entorno de TI o en Amazon EC2 para acceder a los objetos mediante la API de Amazon S3. Este agente se conecta con los puntos de enlace del servicio DataSync dentro de AWS y se administran de manera segura a partir de la consola de administración de AWS o la CLI.

P: ¿Requiere AWS DataSync la configuración de una VPN para conectarse a mi almacenamiento de destino?

R: No. Cuando se copian datos desde o hacia sus instalaciones, no es necesario configurar una VPN o un túnel, ni permitir las conexiones de entrada. Su agente de AWS DataSync puede configurarse para enrutarse a través de un firewall que usa puertos de red estándar. Puede implementar DataSync en su Amazon Virtual Private Cloud (Amazon VPC) mediante los puntos de enlace de la VPC. Con los puntos de enlace de la VPC, los datos transferidos entre el agente de DataSync y los servicios de AWS no atraviesan la Internet pública ni las direcciones IP públicas.

P: ¿Cómo se conectan de manera segura los agentes de AWS DataSync con AWS?

R: Los agentes de AWS DataSync se conectan con los puntos de enlace del servicio dentro de la región de AWS elegida. Cuando crea un agente, puede elegir que este se conecte con los puntos de enlace disponibles para Internet pública, los puntos de enlace validados según los Estándares de procesamiento de la información federal (FIPS) o los puntos de enlace dentro de una de sus VPC. La activación de su agente lo asocia de manera segura con su cuenta AWS. Para obtener más información, consulte Elegir un punto de enlace del servicio y Activar su agente.

P: ¿Cómo se repara y actualiza mi agente de AWS DataSync?

R: Una vez que se activa el agente, AWS aplica automáticamente las actualizaciones de la VM del agente, incluidos el sistema operativo subyacente y los paquetes de software de AWS DataSync. Las actualizaciones se aplican sin interrupciones cuando el agente está inactivo y no está ejecutando una tarea de transferencia de datos.

P: ¿A qué programas de conformidad adhiere AWS DataSync?

R: AWS posee el programa de conformidad de mayor duración en la nube. AWS está comprometida con ayudar a los clientes con sus requisitos. AWS DataSync ha sido evaluado para verificar el cumplimiento de estándares de seguridad globales y del sector. DataSync cumple con los requisitos de PCI DSS, ISO 9001, 27001, 27017 y 27018,SOC 1, 2 y 3, y de la leyHIPAA. DataSync también está autorizado en las regiones EE.UU. Este y Oeste de AWS bajo FedRAMP Moderate y en AWS GovCloud (EE.UU.) bajo FedRamp High. Esto le facilita la verificación de nuestra seguridad y el cumplimiento de sus propias obligaciones. Si desea obtener más información y recursos, visite las páginas sobre temas de conformidad. También puede ir a la página Servicios de AWS en el ámbito del programa de conformidad para ver una lista completa de servicios y certificaciones.

P: ¿AWS DataSync cumple los requisitos normativos de PCI?

R: Sí. AWS DataSync cumple con PCI-DSS, lo que significa que puede usarlo para transferir información de pago. Puede descargar el Paquete de conformidad con PCI en AWS Artifact para obtener más información sobre cómo lograr la conformidad con PCI en AWS.

P: ¿AWS DataSync es compatible con HIPAA?

R: Sí. AWS DataSync es compatible con HIPAA, lo que significa que si tiene un HIPAA BAA establecido con AWS, puede usar DataSync para transferir información protegida de salud (PHI).

P: ¿AWS DataSync tiene autorización provisional moderada de FedRAMP JAB en las regiones Este y Oeste de EE. UU. de AWS?

R: Sí. AWS DataSync recibió una autorización provisional para operar (P-ATO) por parte del Consejo Conjunto de Autorización (JAB) en el Programa Federal de Administración de Autorizaciones y Riesgos (FedRAMP) de referencia moderada en las regiones del Este y Oeste de EE. UU. Si es un cliente federal o comercial, puede usar AWS DataSync en los límites de autorización de las regiones Este y Oeste de AWS con datos hasta un nivel de impacto moderado.

P: ¿AWS DataSync tiene autorización provisional alta de FedRAMP JAB en las regiones AWS GovCloud (EE. UU.)?

R: Sí. AWS DataSync recibió una autorización provisional para operar (P-ATO) por parte del Consejo Conjunto de Autorización (JAB) en el Programa Federal de Administración de Autorizaciones y Riesgos (FedRAMP) de referencia alta en la región GovCloud de EE. UU. Si es un cliente federal o comercial, puede usar AWS DataSync en los límites de autorización de la región AWS GovCloud (EE. UU.) con datos hasta un nivel de impacto alto.

Cuándo elegir AWS DataSync

P: ¿Qué diferencias existen entre AWS DataSync y el uso de herramientas de línea de comandos como rsync o la interfaz de línea de comando de Amazon S3?

R: AWS DataSync automatiza y acelera completamente el traslado de grandes conjuntos de datos activos a AWS. Se integra de forma nativa con Amazon S3, Amazon EFS, Amazon FSx, Amazon CloudWatch y AWS CloudTrail, lo que proporciona un acceso perfecto y seguro a sus servicios de almacenamiento, así como una supervisión detallada de la transferencia.

DataSync usa un protocolo de red personalizado y una arquitectura escalable para transferir datos. Para transferir archivos entre servicios en las instalaciones y de AWS Storage, una sola tarea de DataSync puede usar todo un enlace de red de 10 Gbps.

DataSync automatiza por completo la transferencia de datos. Incluye mecanismos de resiliencia de red y repetición de intentos, optimizaciones de red, programación de tareas integrada, monitoreo a través de la consola y la API de DataSync, y registros, eventos y métricas de CloudWatch que ofrecen una visibilidad detallada sobre el proceso de transferencia. DataSync realiza una verificación de la integridad de los datos tanto durante la transferencia como al momento de su finalización.

DataSync ofrece seguridad total y se integra directamente con los servicios de almacenamiento de AWS. Todos los datos transferidos entre el origen y el destino se cifran con TLS y el acceso a su almacenamiento de AWS se activa mediante mecanismos de seguridad de AWS integrados, como roles de IAM. Data Sync con los puntos de enlace de la VPC están activados para garantizar que los datos transferidos entre una organización y AWS no atraviesan la Internet pública, lo que aumenta la seguridad de los datos a medida que se copian a través de la red.

P: Para transferir objetos entre los buckets, ¿cuándo debo usar AWS DataSync, cuándo debo usar la replicación de S3 y cuándo las operaciones por lote de S3?

R: AWS ofrece varias herramientas para copiar objetos entre los buckets.

Use AWS DataSync para la distribución continua, las canalizaciones y la incorporación de lagos de datos y también para consolidar o separar los datos en varios buckets.

Utilice la replicación de S3 a fin de replicar de forma continua los datos en un bucket de destino específico.

Utilice las operaciones por lote de S3 a fin de operar con lotes a gran escala en los objetos de S3, como para copiar objetos, definir etiquetas o listas de control de acceso (ACL) de los objetos, iniciar restauraciones de objetos de Amazon S3 Glacier Flexible Retrieval (antes conocido como S3 Glacier), invocar una función de AWS Lambda a fin de realizar acciones personalizadas con los objetos, administrar la retención legal del bloqueo de objetos de S3 y las fechas de dicha retención.

P: ¿Cuándo utilizo AWS DataSync y cuándo AWS Snowball Edge?

R: AWS DataSync es perfecto para transferencias de datos en línea. DataSync puede migrar datos activos hacia AWS, transferir datos a la nube a fin de realizar tareas de análisis, archivar datos para liberar espacio de almacenamiento en las instalaciones o replicar datos en AWS para la continuidad empresarial.

AWS Snowball Edge es perfecto para transferencias de datos sin conexión para clientes que tienen restricciones de ancho de banda o que transfieren los datos desde entornos remotos, sin conexión a Internet o limitados. 

P: ¿Cuándo uso AWS DataSync y cuándo AWS Storage Gateway?

R: Use AWS DataSync para migrar los datos existentes a Amazon S3 y luego use la configuración de File Gateway de AWS Storage Gateway a fin de retener el acceso a los datos migrados y de aplicar actualizaciones continuas de las aplicaciones basadas en archivos en las instalaciones.

Puede usar una combinación de DataSync y File Gateway para disminuir la infraestructura en las instalaciones al mismo tiempo que conecta de forma sencilla las aplicaciones locales. AWS DataSync le permite automatizar y acelerar las transferencias de datos en línea a los servicios de AWS Storage. Luego de la fase inicial de transferencia de datos mediante AWS DataSync, File Gateway le ofrece a las aplicaciones en las instalaciones acceso de latencia baja a los datos migrados. Cuando DataSync se usa con recursos compartidos de NFS, se preservan los metadatos POSIX del almacenamiento en las instalaciones de origen y los permisos del almacenamiento de origen se aplican cuando se accede a los datos a través de File Gateway.

P: ¿Cuándo uso AWS DataSync y cuándo uso Amazon S3 Transfer Acceleration?

R: Si sus aplicaciones ya se han integrado con la API de Amazon S3 y usted desea un mayor rendimiento para transferir grandes archivos a S3, puede usar S3 Transfer Acceleration. Use AWS DataSync si quiere transferir los datos desde sus sistemas de almacenamiento existentes (por ejemplo, un almacenamiento dependiente de la red), desde los instrumentos que no pueden cambiarse (por ejemplo, secuenciadores de ADN, cámaras de video) o si desea usar varios destinos. DataSync también automatiza y simplifica la transferencia de datos mediante el suministro de funcionalidades adicionales, como los mecanismos integrados de resiliencia de red y repetición de intentos, la verificación de la integridad de los datos y la configuración flexible para adaptarse a sus necesidades específicas, incluida la limitación controlada del ancho de banda.

P: ¿Cuándo uso AWS DataSync y cuándo AWS Transfer Family?

R: Si actualmente usa SFTP para intercambiar datos con terceros, AWS Transfer Family proporciona una transferencia SFTP, FTPS y FTP completamente administrada directamente hacia y desde Amazon S3, al tiempo que reduce la carga operativa.

Si desea una transferencia de datos acelerada y automatizada entre servidores NFS, recursos compartidos de archivos SMB, clústeres Hadoop, almacenamiento de objetos autoadministrado o en la nube, AWS Snowcone, Amazon S3, Amazon EFS y Amazon FSx, puede usar AWS DataSync. DataSync es idóneo para los clientes que necesitan llevar a cabo migraciones en línea de conjuntos de datos activos, transferencias oportunas de datos que se generan continuamente o replicación para la continuidad del negocio. 

Más información sobre los precios de DataSync
Más información acerca de los precios

AWS DataSync tiene precios simples, predecibles, con base en el uso y pasa solo por la cantidad de datos que copia.  

Más información 
Regístrese para obtener una cuenta de AWS
Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS. 

 

Registrarse 
Comience a usar DataSync en la consola
Comience a migrar datos en la consola

Comience a crear con AWS DataSync en la consola de AWS.

Iniciar sesión