Migración de datos a la nube

Traslade los datos locales a AWS para migraciones o flujos de trabajo en curso

Los datos son el punto principal de las implementaciones exitosas de aplicaciones, los flujos de trabajo de análisis y las innovaciones de aprendizaje automático. Al trasladar datos a la nube, debe comprender a dónde los está trasladando según cada caso de uso, los tipos de datos que está trasladando y los recursos de red disponibles, entre otras consideraciones. AWS ofrece una amplia variedad de servicios y herramientas de socios que ayudan a migrar los conjuntos de datos, ya sean archivos, bases de datos, imágenes de máquinas, volúmenes de bloques o incluso copias de seguridad en cinta.

Prácticas recomendadas para la migración de datos a AWS (50:07)

Servicios de migración de datos a la nube de AWS

El conjunto de servicios de transferencia de datos creado por AWS incluye muchos métodos que ayudan a migrar los datos de manera más efectiva. Puede dividirlos en dos categorías; la transferencia de datos en línea y el almacenamiento en la nube híbrida, y la migración de datos sin conexión a Amazon S3.

Transferencia de datos en línea y almacenamiento en la nube híbrida

Estos métodos simplifican la creación de un enlace de red a la VPC, la transferencia de datos a AWS o el uso de S3 para el almacenamiento en la nube híbrida con las aplicaciones locales existentes. Estos servicios pueden ayudarlo a realojar grandes conjuntos de datos una vez, así como a integrar flujos de procesos existentes, como, por ejemplo, copias de seguridad y recuperación, o streams de datos continuos directamente con el almacenamiento en la nube.

AWS Direct Connect

El cliente selecciona una conexión física dedicada de Direct Connect para acelerar las transferencias de red entre sus centros de datos y los nuestros.

AWS Direct Connect permite establecer una conexión de red dedicada entre su red y una de las ubicaciones de AWS Direct Connect. Gracias al uso de redes VLAN 802.1q estándar del sector, esta conexión exclusiva se puede dividir en varias interfaces virtuales. Esto permite utilizar la misma conexión para acceder a recursos públicos como, por ejemplo, objetos almacenados en Amazon S3 utilizando un espacio de direcciones IP públicas, y a recursos privados como, por ejemplo, instancias de Amazon EC2 que se ejecutan dentro de Amazon Virtual Private Cloud (VPC), utilizando un espacio de IP privado al tiempo que se mantiene la separación de red entre los entornos públicos y privados. Las interfaces virtuales se pueden volver a configurar en cualquier momento para que satisfagan sus necesidades cambiantes.

Explore nuestros paquetes de socio de Direct Connect que ayudan a extender las tecnologías locales a la nube. 

AWS DataSync

AWS DataSync es un servicio de transferencia de datos que facilita la automatización del traslado de datos entre el almacenamiento local y Amazon S3 o Amazon Elastic File System (Amazon EFS). DataSync maneja automáticamente muchas de las tareas relacionadas con las transferencias de datos que pueden ralentizar las migraciones o atascar las operaciones de TI, incluidas la ejecución de sus propias instancias, el manejo del cifrado, la administración de scripts, la optimización de red y la validación de la integridad de los datos. Puede usar DataSync para transferir datos con una velocidad hasta 10 veces superior a la de las herramientas de código abierto. Puede utilizar DataSync para copiar datos de AWS Direct Connect o enlaces de Internet a AWS para las migraciones de datos únicas, los flujos de trabajo de procesamiento de datos recurrentes y la replicación automatizada para la protección y la recuperación de datos.

AWS Storage Gateway

El servicio de AWS Storage Gateway simplifica la adopción local del almacenamiento de AWS. Sus aplicaciones existentes se conectan con una gateway local mediante protocolos de almacenamiento de cintas y en bloque estándar del sector para almacenar datos en Amazon S3 y Amazon Glacier. Los datos se comprimen y se transfieren de forma segura a AWS.

  • La gateway de archivos presenta recursos compartidos de archivos SMB o NFS para aplicaciones locales que sirven para almacenar archivos como objetos S3 y acceder a ellos con las interfaces de archivos tradicionales.
  • La configuración de la biblioteca virtual de cintas (VTL) de Tape Gateway se integra a la perfección con el software de copia de seguridad existente para el reemplazo rentable de cintas en Amazon S3 y el archivo a largo plazo en S3 Glacier y S3 Glacier Deep Archive.
  • La gateway de volúmenes almacena o guarda en caché los volúmenes de bloques localmente, con copias de seguridad de un punto en el tiempo como instantáneas de EBS. Estas instantáneas se pueden recuperar en la nube.

Amazon S3 Transfer Acceleration

Amazon S3 Transfer Acceleration incrementa la velocidad de las transferencias a Amazon S3 que se realizan a través del Internet público. Puede maximizar su ancho de banda independientemente de la distancia o de las variaciones en la capacidad de Internet, sin necesidad de clientes especiales o protocolos de red propios. Simplemente cambie el extremo que utiliza con el bucket de S3 y se aplicará la aceleración automáticamente.

Es ideal para los trabajos periódicos que se transfieren de una parte a otra del mundo, como las cargas de medios, las copias de seguridad y las tareas de procesamiento de datos locales que se envían de forma frecuente a una ubicación central.

Amazon Kinesis Data Firehose

Amazon Kinesis Data Firehose es la forma más fácil de cargar datos de streaming en AWS. Puede capturar y cargar automáticamente datos de streaming en Amazon S3 y Amazon Redshift, habilitando así el análisis casi en tiempo real con las herramientas de inteligencia empresarial existentes y los paneles de control que ya usa actualmente. Se trata de un servicio totalmente administrado que se escala automáticamente para adaptarse al rendimiento de los datos y no precisa de ninguna administración permanente. También puede procesar por lotes, comprimir y cifrar los datos antes de cargarlos, a fin de minimizar la cantidad de almacenamiento utilizado en el destino y aumentar la seguridad. Puede crear fácilmente una transmisión de entrega de Firehose desde la consola de administración de AWS, configurarla con unos pocos clics y comenzar a enviar datos a la transmisión desde cientos de miles de orígenes de datos para que se carguen continuamente en AWS, y todo en pocos minutos.

Productos de socios de APN

AWS se ha asociado con una serie de proveedores del sector para el uso de dispositivos de gateway física que cierran la brecha entre la copia de seguridad tradicional y la nube. Enlace los datos en las instalaciones existentes con la nube de Amazon para realizar el traslado sin afectar el rendimiento y conservando los catálogos de copias de seguridad existentes.

  • Se integra a la perfección en la infraestructura existente
  • Puede ofrecer anulación de duplicación, compresión, cifrado o aceleración de WAN
  • Almacene localmente en caché copias de seguridad recientes y guárdelo todo en la nube de AWS

Migración de datos sin conexión a Amazon S3

No se debe subestimar el ancho de banda que ocupa un semicamión con 100 petabytes de discos duros, o un dispositivo del tamaño de una maleta de 100 TB. Estos servicios de migración de datos sin conexión que utilizan dispositivos resistentes que se pueden enviar son ideales para mover grandes archivos, lagos de datos, o en situaciones donde el ancho de banda y los volúmenes de datos no pueden pasar por sus redes dentro del tiempo deseado.

AWS Snowball

AWS Snowball es una solución de transferencia de datos a escala de petabytes que emplea dispositivos seguros para transferir grandes volúmenes de datos hacia y desde AWS. La utilización de Snowball permite resolver los desafíos propios de las transferencias de datos a gran escala, entre los que se incluye los anchos de banda limitados, los tiempos prolongados de transferencia y las preocupaciones de seguridad. Transferir datos con Snowball es simple, rápido y seguro.

AWS Snowball Edge

AWS Snowball Edge es un dispositivo de transferencia de datos a escala de petabytes con capacidades informáticas y de almacenamiento a bordo. Puede utilizar Snowball Edge para transferir grandes cantidades de datos hacia y desde AWS, como una capa de almacenamiento temporal para los conjuntos de datos de gran tamaño o para respaldar las cargas de trabajo locales en ubicaciones remotas o sin conexión.

AWS Snowmobile

AWS Snowmobile es una solución de transporte de datos a escala de exabytes que utiliza un semicontenedor de envío seguro de 12 metros y que sirve para transferir grandes cantidades de datos desde y hacia AWS. La utilización de Snowmobile permite resolver los desafíos propios de las transferencias de datos a gran escala, incluyendo, los altos costos de red, los largos períodos de transferencias y las preocupaciones de seguridad. Las transferencias de datos con Snowmobile se realizan mediante una plataforma personalizada que es segura, rápida y puede suponer tan solo una quinta parte del costo del Internet de alta velocidad.

Herramientas de migración de datos a la nube no administradas

AWS también ofrece herramientas sencillas de script o CLI para transferir datos locales al almacenamiento en la nube de Amazon.

rsync

Los clientes utilizan rsync, una herramienta de código abierto, junto con herramientas de sistemas de archivos de terceros para copiar datos directamente en buckets de S3.

Interfaz de línea de comandos de S3

Los clientes utilizan la CLI de Amazon S3 para escribir comandos que permiten trasladar los datos directamente hacia los buckets de S3.

Interfaz de línea de comandos de S3 Glacier

Los clientes utilizanla CLI de Amazon Glacier para trasladar datos hacia los almacenes de Glacier.

El reto común de la migración de datos a la nube

La abrumadora realidad del transporte de datos se aplica a la mayoría de los proyectos. ¿Cómo puede trasladarse con fluidez de la ubicación actual a la nueva nube, con el mínimo de interrupción, costo y tiempo? ¿Cuál es la forma más inteligente de hacer efectivo el traslado de sus GB, TB o PB de datos?

Se trata de un problema subyacente básico: ¿qué cantidad de datos puede trasladar, a qué distancia y con qué rapidez? Para un caso ideal, utilice esta fórmula:

Número de días = (bytes totales)/(megabits por segundo * 125 * 1000 * uso de red * 60 segundos * 60 minutos * 24 horas)

Por ejemplo, si tiene una conexión T1 (1,544 Mbps) y 1 TB (1024 * 1024 * 1024 * 1024 bytes) que introducir o sacar de AWS, el tiempo mínimo teórico que tardaría en cargarse a través de la conexión de red a un uso de red del 80% sería 82 días.

Relájese. Ya hemos hecho esto antes. Hemos podido constatar que los clientes abordan esta cuestión de dos formas: utilizan herramientas de migración no administradas muy básicas para trasladar los datos o seleccionan uno de los conjuntos de servicios de Amazon como se mencionó anteriormente.

Como regla básica general, para obtener los mejores resultados sugerimos lo siguiente:

Conexión Escala de datos Método
Menos de 10 Mbps Menos de 500 GB No administrado
Más de 10 Mbps Más de 500 GB Servicio administrado